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Prólogo 


El lenguaje y los conceptos de la teoría de matrices y, más generalmente 
del Algebra Lineal han llegado también a aplicarse en las ciencias natu- 
rales y en las ciencias sociales. Pero eso no priva que el Algebra Lineal 
continúe teniendo su importancia extraordinaria en el tratamiento moderno 
de la geometría y el análisis. 

El propósito esencial de este libro es presentar cuidadosamente los 
principales temas del álgebra lineal e ilustrar la utilidad de la materia a 
través de una amplia variedad de aplicaciones. Aunque para el uso for- 
mal de este libro se supone que los alumnos han debido llevar un curso 
previo de cálculo, el contenido de los capítulos 6 y 7 no requieren más 
aparato matemático que el contenido en los estudios de enseñanza media 
superior en los cuales puede haber habido o no una iniciación al álgebra 
lineal. 

El libro está concebido de manera tal que permite ser utilizado en 
cursos de diferente duración. El material esencial del álgebra lineal (es- 
pacios vectoriales, transformaciones lineales y matrices, sistemas de ecua- 
ciones lineales, determinantes y diagonalización), se encuentra en los 
capítulos 1 al 5; los otros capítulos, que tratan las formas canónicas y 
espacios con producto interior, son completamente independientes y que 
se pueden estudiar en cualquier orden. Además, a lo largo del libro se 
encuentran diversas aplicaciones para áreas tales como ecuaciones dife- 
renciales, economía, geometría y física. Estas aplicaciones, claro está, 
no son imprescindibles para el desarrollo matemático y pueden muy bien 
eliminarse a criterio del profesor. 

Hemos procurado que resultara posible abarcar la mayoría de los te- 
mas importantes de álgebra lineal en un curso semestral. Esta meta nos 
permitió desarrollar los temas más importantes con menos preliminares 
innecesarias, que en los textos tradicionales. Nuestro tratamiento de la 
forma canónica de Jordan, por ejemplo, no requiere de la teoría de 
polinomios. La economía lograda en extensión permite desarrollar la 
mayor parte del libro (si se omiten muchas de las partes optativas y 
el análisis detallados de los determinantes), en un curso semestral de 
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4 horas semanales para aquelios estudiantes que hayan tenido conocimien- 
tos previos de álgebra lineal. 

El capítulo 1 del libro presenta la teoría básica de espacios vectoriales 
de dimensiones finitas, subespacios, combinaciones lineales, dependencia 
e independencia lineal, bases y dimensión. El capítulo termina con una 
sección optativa en la cual se prueba la existencia de una base en los espa- 
cios vectoriales de dimensiones infinitas. 

En el capítulo 2 se desarrollan las transformaciones lineales y sus 
relaciones con las matrices; ahí se discute el espacio vacío y el límite de 
una transformación lineal, representaciones matriciales de una transfor- 
mación, isomorfismos y cambios de coordenadas. El capítulo se termina 
con las secciones opcionales sobre espacios duales y ecuaciones lineales 
diferenciales homogéneas. 

En el capítulo 3 se encuentran las aplicaciones de la teoría de espa- 
cios vectoriales y transformaciones lineales a los sistemas de ecuaciones 
lineales. Este importante tema lo hemos pospuesto intencionadamente 
para que se pueda presentar como consecuencia del material anterior. 
Este enfoque da pie al tema familiar de los sistemas lineales para aclarar 
la teoría abstracta, y permite evitar confusos cálculos de matrices en los 
capítulos 1 y 2. En esos capítulos habrá ejemplos ocasionales donde ten- 
dremos la oportunidad de solucionar sistemas de ecuaciones lineales (na- 
turalmente estos ejemplos no forman parte del desarrollo teórico). En la 
sección 1.4 se hallan las bases necesarias para ello. 

Los determinantes, tema del capítulo 4, tienen ahora mucho menos 
importancia que hace algún tiempo, para un curso abreviado es preferible 
tratarlos ligeramente, puesto que consideramos necesario dedicar más 
tiempo a los temas que se desarrollan del capítulo 5 al 7. De ahí que 
hayamos presentado dos alternativas en el capítulo 4: un desarrollo com- 
pleto de la teoría (secciones 4.1 a 4.4) y un resumen de los puntos 
importantes, indispensables para el resto de los capítulos (sección 4.5). 

En el capítulo 5 se desarrollan eigenvalores, eigenvectores y diago- 
nalización. Una de sus aplicaciones más importantes se encuentra en el 
cálculo de límite de matrices. Se ha incluido, sin embargo, una sección 
opcional sobre límite de matrices y cadenas de Markov, aunque la general 
mayoría de algunos de sus resultados requiera un conocimiento de las 
formas canónicas de Jordan. Las secciones 5.4, 5.5 y 5.6 contienen in- 
formación sobre subespacios invariantes, el teorema de Cayley-Hamilton 
y del polinomio mínimo, respectivamente. 

Las formas canónicas se tratan en el capítulo 6, secciones 6.1 y 6.2 
desarrollan la forma Jordan y la sección 6.3 presenta la forma racional. 

Los espacios con producto interior son el tema del capítulo 7. La teo- 
ría matemática básica (productos interiores y el proceso de ortogonali- 
zación de Gram-Schmidt; las transformaciones del adjunto: normal, auto- 
adjunto, ortogonal y operadores unitarios; proyecciones ortogonales y el 
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teorema espectral) se desarrollan en las secciones 7.1, 7.2, 7.3, 7.5, 7.7 
y en la 7.9. En las secciones 7.4, 7.6, 7.8 y 7.10 se encuentran varias 
aplicaciones de la estructura del producto de interior. El capítulo ter- 
mina con un análisis de las formas cuadráticas y bilineales (sección 7.11). 

En el texto se encuentran también cinco apéndices. En los primeros 
cuatro se analizan respectivamente, conjuntos, funciones, campos y núme- 
ros complejos con el fin de repasar las ideas básicas que se desarrollan 
a través del libro. En apéndice E sobre polinomios se utiliza primor- 
dialmente en los capítulos 5 y 6, en especial en la sección 6.3. Se ha 
preferido que esos apéndices no se analicen en forma independiente sino 
hacer referencia a ellos según se requiera. 


El siguiente diagrama muestra la dependencia entre los capítulos del 
libro. 


1 
! 


f 
Capítulo 1 


Capítulo 2 


Capítulo 3 


Secciones 4.1-4.4 
o secciones 4.5 


Secciones 5.1 y 5.2 


Sección 5.4 


Capítulo 7 


Secciones 5.5 y 5.6 


Secciones 6.1 y 6.2 


Sección 6.3 


Ahora unas palabras finales, que creemos necesarias respecto a nues- 
tra notación. Las secciones indicadas con un asterisco (*) son opcionales 
y pueden omitirse si así lo considera el profesor. Todo ejercicio indicado 
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por el símbolo (f) no es opcional; lo usamos para identificar un ejer- 
cicio que será citado posteriormente en el texto. 

Agradecemos a Douglas E. Cameron (University of Akron), Ed- 
ward C. Ingraham de (Michigan State University), David E. Kullman 
(Miami University), Carl D. Meyer, Jr. (North Carolina State University) 
y Jean E. Rubin (Purdue University) por haber revisado el manuscrito 
completo del texto, así como también a nuestros colegas y estudiantes 
por las sugerencias y estímulos recibidos durante el periodo en el que se 
estaba desarrollando el manuscrito de esta obra. También hacemos men- 
ción especial a Miss Jana Gehrke y a Marilyn Parmantie por su ayuda 
en el trabajo de mecanografía, así como a Harry Gaines, lan List y al 
equipo de Prentice-Hall por su colaboración durante los procesos de pro- 
ducción. 
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LAWRENCE E. SPENCE 


Capítulo 1 


Espacios vectoriales 


1.1 


INTRODUCCION 


Muchas nociones físicas comunes, tales como las fuerzas, velocidades * y 
aceleraciones, involucran una magnitud (el valor de la fuerza, velocidad 
o aceleración) y una dirección. Cualquier entidad que involucre magni- 
tud y dirección se llama vector. Los vectores se representan por flechas 
en las que la longitud de ellas define la magnitud del vector, y la direc- 
ción de la flecha representa la dirección del vector. En la mayor parte 
de las situaciones físicas que involucran vectores, únicamente la magnitud 
y dirección del vector son significativas; consecuentemente, consideraremos 
a los vectores con la misma magnitud y dirección como iguales, indepen- 
dientemente de sus posiciones relativas. 

En esta sección se discutirá la geometría de los vectores, geometría que 
se deriva de los experimentos físicos que dan fe de la forma de inter- 
acción entre dos vectores. 

Muchas situaciones comunes sugieren que cuando dos vectores actúan 
simultáneamente en un punto, la magnitud del vector resultante (el vector 
obtenido sumando los dos vectores originales) no es necesariamente igual 
a la suma de las magnitudes de los dos vectores. Por ejemplo, un nadador 
que nada contra la corriente con una velocidad promedio de 3.2 km/h, 
siendo la velocidad de la corriente de 1.6 km/h, no avanzará con una 
velocidad promedio de 4.8 km/h. En este caso los movimientos del 
nadador y el de la corriente son contrarios y, por tanto, la velocidad pro- 
medio del nadador es únicamente de 1.6 km/h. Si, por el contrario, el 
nadador avanzara aguas abajo (a favor de la corriente), entonces su 
avance promedio sí sería de 4.8 km/h. 

Los experimentos muestran que los vectores se suman de acuerdo 
con la siguiente ley del paralelogramo. (Véase la fig. 1.1.) 


* La palabra “velocidad” está siendo utilizada con su connotación científica, 
como una entidad que tiene magnitud y dirección. La magnitud de una velocidad 
(independientemente de la dirección del movimiento) se llama rapidez. 
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figura 1.1 


Ley del Paralelogramo para la Suma de Vectores. La suma de dos vectores x 
y y que actúan sobre un mismo punto P es el vector que, en el paralelo- 
gramo que tiene a x y y por lados adyacentes, se representa por la 
diagonal que parte de P. 


Como los lados opuestos de un paralelogramo son paralelos y de igual 
longitud, el extremo Q de la flecha que representa a x + y también se 
puede obtener permitiendo que x actúe sobre P y luego permitiendo que 
y actúe sobre el extremo de x; o, de la misma manera, puede ser obtenido 
permitiendo que primero actúe y sobre P y posteriormente que x actúe 
sobre el extremo de y. De este modo, dos vectores x y y que actúan sobre 
un punto P pueden ser sumados “cola con cabeza”; esto es, se puede 
aplicar cualquiera de los vectores x o y en P y un vector que tenga la 
misma magnitud y dirección que el vector restante puede ser aplicado 
entonces en el extremo del primero —el extremo de este segundo vector 
es el extremo de x + y. 

La suma de vectores puede ser descrita algebraicamente mediante el 
uso de geometría analítica. En el plano que contiene a x y a y, introdúz- 
case un sistema de coordenadas con P por origen y sea (a,, az) cl extremo 
de x y (b,, b) el de y. Entonces, tal como lo muestra la figura 1.2, 
las coordenadas de Q, extremo de x + y, son (a, + b,, az + b2). De aquí 
en adelante, cuando se haga referencia a las coordenadas del extremo de 
un vector, se considerará que el vector parte del origen. Mas aún, como un 
vector que principia en el origen queda completamente determinado por 
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figura 1.2 
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las coordenadas de su punto extremo, nos referiremos algunas veces al 
punto x en vez de al extremo del vector x cuando x sea un vector que 
parte del origen. 

Además de la operación de suma de vectores existe otra operación 
natural que se puede realizar con los vectores —la longitud de un vector 
puede ser amplificada o reducida sin cambiar la dirección del vector. Esta 
operación, llamada multiplicación por un escalar, consiste en multiplicar 
un vector por un número real. Si el vector x está representado por una 
flecha, se tiene que para cualquier número real 1 > 0 el vector fx que- 
dará representado por una flecha que tiene la misma dirección de la 
flecha que representa a x pero su longitud será 1 veces mayor. Si t < 0, 
el vector tx quedará representado por una flecha cuya dirección sea 
opuesta a la de x y con una longitud de | £| veces la longitud de la flecha 
que representa a x. Dos vectores no nulos x y y se denominan paralelos 
si y = tx para cualquier número real £ no nulo. (Así, los vectores no nulos 
con direcciones iguales u opuestas, son paralelos.) 

Para describir algebraicamente la multiplicación por escalares, intro- 
dúzcase de nuevo un sistema de coordenadas en un plano que contenga 
al vector x tal que x parta del origen. Si el extremo de x tiene por 
coordenadas a (a, a,), entonces puede mostrarse fácilmente que las 
coordenadas del extremo de tx son (ta,, ta»). (Véase el ejercicio 5.) 

Las descripciones algebraicas de la suma de vectores y de la multi- 
plicación de vectores por escalares en un plano, implican las siguientes 
propiedades para vectores arbitrarios x, y, y z y números reales arbitra- 
rios a y b: 


x+y=y+x. 

(x+y) +z=x+(y+z). 

Existe un vector llamado 0 tal que x + 0 = x para todo vector x. 
Para cada vector x existe un vector y tal que x + y = 0. 

lx =x. 

(ab)x = a(bx). 

alx + y) = ax + ay. 

(a + b)x = ax + bx. 


E A 


Argumentos semejantes a los antes mencionados muestran que estas 8 
propiedades, así como las interpretaciones geométricas de suma de vecto- 
res y multiplicación por escalares, son válidas para vectores que actúan 
en el espacio y no sólo en un plano. Utilizaremos estos resultados para 
escribir las ecuaciones de rectas y planos en el espacio. 

Considérese primero la ecuación de una recta en el espacio que pasa 
por dos puntos distintos P y Q. Sea O el origen de un sistema de coorde- 
nadas en el espacio y sean u y v los vectores que parten de O y terminan 
respectivamente en P y Q. Si w es el vector que principia en P y termina 
en Q, la suma “cabeza con cola” muestra que u + w =v y por tanto 
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w= v=—u donde —u representa al vector (—1)u. (Véase la fig. 1.3 
en donde el cuadrilátero OPQR es un paralelogramo.) Como un múltiplo 
de escalar w es paralelo a w, pero posiblemente de una longitud diferente 
a w, cualquier punto de la recta que une a P y Q se puede obtener como 
el extremo del vector que principia en P y que tiene la forma tw para 


figura 1.3 


algún número real t. Recíprocamente, el extremo de cada vector de la 
forma tw que principia en P yace en la línea que une a P y O. Luego, 
una ecuación de la recta que pasa por P y Q es x = u + tw = u + t(v—u), 
donde 1 es un número real y x es un punto arbitrario de la recta. Véase 
también que el extremo R del vector v — u de la fig. 1.3 tiene coorde- 
nadas iguales a la diferencia de las coordenadas de Q y P. 


Ejemplo. ¿Encontremos la ecuación de la recta que pasa por los pun- 
tos P y Q de coordenadas (—2, 0, 1) y (4, 5, 3), respectivamente. 
El extremo R del vector que parte del origen y que tiene la misma direc- 
ción que el vector que principia en P y termina en O, tiene como coor- 
denadas (4, 5, 3) — (-2,0, 1) = (6, 5, 2). Luego, la ecuación buscada 
será: 


x= (-2, 0, 1) + 1(6, 5, 2). 


Ahora, sean P, Q y R tres puntos no colineales en el espacio. Estos 
puntos determinan un plano único cuya ecuación puede ser encontrada 
mediante el uso de nuestras anteriores observaciones sobre vectores. Sean 
u y v los vectores que parten de P y terminan, respectivamente, en Q yR. 
Obsérvese que cualquier punto del plano que contenga a P, Q y R es 
el extremo S de un vector x que principia en P y tiene la forma tu + tv 
para cualquier par de números reales t, y t.. El extremo de tu será el 
punto de intersección de la recta que pasa por P y Q con la recta que 
pasa por $ y es paralela a la recta que pasa por P y R. (Véase fig. 1.4.) 
Un procedimiento análogo permitirá localizar tv. 
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figura 1.4 


Mas aún, para cualquier par de números reales f, y t, Lu + təv es un 
vector ubicado en el plano que contiene a P, Q y R. Por lo tanto, la 
ecuación del plano que contiene a P, Q y R es 


x= P + tu + ty, 


donde t, y t. son números reales arbitrarios y x es un punto cualquiera 
del plano. 


Ejemplo. Sean P, Q y R puntos de coordenadas (1, 0, 2), (—3, —2, 4) 
y (1, 8, —5), respectivamente. El extremo del vector que parte del origen 
y tiene la misma longitud y dirección que el vector que va de P a Q es 
(—3, —2, 4) — (1, 0, 2) = (-4, —2, 2); de la misma forma, el 
extremo del vector que parte del origen y tiene la misma longitud y 
dirección que el vector que va de P a R es (1, 8, —5) — (1, 0, 2) = 
= (0, 8, —7). Luego, la ecuación del plano que contiene a los tres 
puntos dados es 


x= (1,0, 2) + t,1(—4, —2, 2) + £2(0, 8, —7). 


Cualquier estructura matemática que posea las ocho propiedades de 
la página 3 se llama “espacio vectorial”. En la sección siguiente defini- 
remos formalmente un espacio vectorial y consideraremos muchos ejem- 
plos de espacios vectoriales distintos a los antes mencionados. 


EJERCICIOS 


1. Determinar si los vectores que parten del origen y terminan en los siguientes 
pares de puntos son paralelos. 


(a) (3, 1, 2) y (6, 4, 2) 

(BJ. (—3, L 7) y (9, =3, =21) 
(c) (5, —6, 7) y (—5, 6, —7) 
(d) (2,0, —5) y (5, 0, —2) 


1.2 
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Encontrar las ecuaciones de las rectas que pasan por los siguientes pares 
de puntos en el espacio. 


(a) (3, —2, 4) y (-5,7, 1) 
(b) (2, 4,0) y (-3, -6, 0) 
(c) (3,7,2) y (3, 7, -8) 

(d)  (-2, —1, 5) y (3, 9,7) 


Encontrar las ecuaciones de los planos que contienen los siguientes puntos 
en el espacio. 


(a) (2, —=5, —1), (0, 4, 6) y (-3, 7, 1) 
(b) (3, —6, 7), (-2, 0, -4) y (5, —9, —2) 
(c) (8, 2, 0), (1, 3, 0) y (6, ~5, 0) 

(d) (1, 1, 1), (5,5, 5) y (—6, 4, 2) 


¿Cuáles son las coordenadas del vector O en el plano Euclidiano que satis- 


facen la condición 3 de la página 3. Demostrar que esta selección de coorde- 
nadas satisface la condición 3. 


Demostrar que si el vector x parte del origen del plano Euclidiano y termina 
en el punto de coordenadas (a,, a»), entonces el vector fx que parte del 
origen termina en el punto de coordenadas (ta,, ta,). 


Demostrar que las diagonales de un paralelogramo se bisectan. 


ESPACIOS VECTORIALES 


Debido a que entidades tan diversas como las fuerzas que operan en un 
plano y los polinomios con coeficientes reales permiten definiciones natu- 
rales de suma y multiplicación por escalares que poseen las propiedades 


l a 8 de la página 3, es evidente que se deban abstraer dichas propieda- 
des en la siguiente definición. 


DEFINICIÓN. Un espacio vectorial (o espacio lineal) V sobre un campo * F 


consiste de un conjunto en el que están definidas dos operaciones (llama- 
das adición y multiplicación por escalares, respectivamente), tal que para 
cualquier par de elementos x y y en V exista un elemento único x + y 
en V, y para cada elemento a en F y cada elemento x en V exista un 
elemento único ax en V, de manera que se cumplan las siguientes con- 
diciones: 


* Ver apéndice C. Sin embargo, con muy pocas excepciones, el lector puede 
interpretar la palabra “campo” como “campo de los números reales” (denotado 
por R) o “campo de los números complejos” (denotado por C). 
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(VS 1) Para toda x, y en V, x + y = y + x (conmutatividad de la 
adición). 

(VS 2) Para toda x, y, z en V, (x + y) +z=x + (y +2) (aso- 
ciatividad de la adición). 

(VS 3) Existe un elemento en V llamado O tal que x+0=x 
para toda x en V. 

(VS 4) Para cada elemento x en V, existe un elemento y en V tal 
que x+y=0, 

(VS 5) Para cada elemento x en V, 1x = x. 

(VS 6) Para cada par a, b de elementos en F y cada elemento x 
en V, (ab)x = a(bx). 

(VS 7) Para cada elemento a en F y cada par de elementos x, 
y en V, a(x + y) = ax + ay. 

(VS 8) Para cada par de elementos a, b en F y cada elemento x 
en V, (a + b)x = ax + bx. 


Los elementos x+ y y ax se denominan, respectivamente, suma de x 
y y y el producto de a y x. 


Los elementos del campo F se llaman escalares y los elementos del 
espacio vectorial V se llaman vectores. El lector no debe confundir este 
uso de la palabra “vector” con la entidad física tratada en la` sección 1.1; 
ahora, la palabra “vector” se utilizará para describir cualquier elemento 
de un espacio vectorial. 

Frecuentemente, un espacio vectorial será tratado en el texto sin men- 
cionar explícitamente su campo de escalares. El lector cuidará de recordar, 
sin embargo, que todo espacio vectorial debe considerarse como un espa- 
cio vectorial sobre un campo, el que se denotará por F. 

En el resto de la sección introduciremos diversos ejemplos importantes 
de espacios vectoriales que serán estudiados a través del texto. Obsérvese 
que al describir un espacio vectorial no sólo es necesario especificar los 
vectores, también las operaciones de suma y multiplicación por escalares. 


Un objeto de la forma (a, ..., an), donde los valores o entradas 
a; son elementos de un campo F, se denomina n-dimensional * con 
valores de F. Dos n-dimensionales (a, ... , an) y (bı, ... bn) se defi- 


nen como iguales si y sólo si a, = b; para i = 1, 2,..., n. 


Ejemplo 1. El espacio vectorial F" de n-dimensionales con valores de 
un campo F. 

El conjunto de todas las n-dimensionales con valores de un campo F 
forma un espacio vectorial, que denotaremos por Fr, bajo las operaciones 
de suma y multiplicación coordinada (elemento a elemento); esto es, si 
x= (A, ..., na) EF" y=(b,..., br) € Fr, y c EF, entonces 


xXFyY= (A HDi... , On HD) y cx= (ca, ..., Can). 


* N. del T. En algunos libros de álgebra lineal a los n-dimensionales se 
les da el nombre de n-adas, n-uplas, n-tuplas y otros más, pero aquí preferiremos 
la citada denominación. 
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Por ejemplo, en R* 


(3, 2, 0,5) + (—1, 1, 4, 2) = (2, —1, 4, 7) 


=5$(1, —2, 0, 3) = (—5, 10, 0, —15). 


Los elementos de F° a menudo se escribirán como vectores columna: 


a; 


¡An 

en vez de como vectores renglón (a,, ... , an). Puesto que un 1-dimen- 
sional con valor de F puede ser visto como elemento de F, escribiremos 
F en vez de F! para el espacio vectorial de los 1-dimensionales de F. 


Una matriz de m x n con valores de un campo F es un arreglo rec- 
tangular de la forma 


dii di2 ... din 
dar A32 +... Azn 
° ? 
Ami Am2 ->> Amn 


donde cada elemento a;;(1 <i <m, 1 <j <n) pertenece a F. Los ele- 
mentos Aii, Giz, ... , Gin de la matriz anterior forman el i-ésimo renglón 
de la matriz y se considerarán a menudo como un vector renglón en Fr, 
mientras que los elementos aij, G»;, ... , Gm; forman la columna j-ésima 
de la matriz y serán a menudo considerados como un vector columna 
en F”. La matriz de m x n en la que cada elemento es igual a O se deno- 
mina matriz cero. 

En este libro escribiremos las matrices con letras mayúsculas cursivas 
(p. ej, A, B y C) y denotaremos al elemento de la matriz A ubicado 
en el renglón i y la columna j por A;;. Además, si el número de renglones 
es igual al número de columnas de una matriz, ésta se denominará cua- 
drada. 

Dos matrices de m x n, A y B se definen como iguales si y sólo 
si sus elementos correspondientes son iguales; esto es, si y sólo si 
Ai; = Bi; para 1<i<my1<j<n. 
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Ejemplo 2. El espacio vectorial Mmxn(F) de matrices m x n con valo- 
res de un campo F. 


El conjunto de todas las matrices de m x n con elementos de un cam- 
po F es un espacio vectorial, que denotaremos por Mmxn(F), bajo las 
siguientes Operaciones de suma y multiplicación por escalares: para A, 
BE Mmxa (F) y cE F, 


(A + B); = As; + B; y (cA)i; = cAi; 


Por ejemplo 


en Mess (R). 


Ejemplo 3. El espacio vectorial F(S, F) de todas las funciones de un 
conjunto $ en un campo F. 


Sea $ un conjunto no vacío y F cualquier campo, y sea F(S, F) el 
conjunto de todas las funciones que van de S a F. Dos elementos f y 8g 
en F(S, F) se definen como iguales si f(s) = g(s) para cada s€ S. 
El conjunto F(S, F) es un espacio vectorial bajo las operaciones de 
suma y multiplicación por escalares definidas para f, g, € F(S, F) y 
cE F por 


(F+ gs) =H5) + gls) y (cf)(s) = clf(s)] 


para cada s€ S$. Nótese que éstas son las operaciones normales de suma 
y producto por escalares utilizadas en cálculo. 


Un polinomio con coeficientes de un campo F es una expresión de 
la forma 


f(x) = anx" + anx +... + ax + ao, 
donde n es un entero no negativo y a,, ..., as son elementos de F. 
Si f(x) = 0, esto es, si ah = ... = 4, = 0, entonces f(x) se llama el 


polinomio cero y se dice que el grado de f(x) es —1; de otra forma, 
se define el grado de un polinomio como el mayor exponente de x que 
aparece en la representación 


f(x) = aX" + apax! t ... +a 
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correspondiente a un coeficiente no nulo. Nótese que los polinomios de 
grado cero son funciones de la forma f(x) = c para algún escalar c no 
nulo. 

Dos polinomios f(x) y g(x) son iguales si y sólo si tienen el mismo 
grado y los coeficientes de potencias iguales son iguales. 

Cuando F es un campo que contiene un número infinito de elementos, 
normalmente consideraremos un polinomio con coeficientes de F como 
una función de F en F. En este caso, el valor de la función 


f(x) = aX” + anx H... F aa 
en cE F es el escalar 
f(c) = anc” + anie H n... +a. 


Aquí, es posible utilizar cualquiera de las dos notaciones f o f(x) para 
la función polinomial 


f(x) = AX” + Ay X”! +... + do. 


Ejemplo 4. El espacio vectorial P(F) de todos los polinomios con coefi- 
cientes de un campo F. 


El conjunto de todos los polinomios con coeficientes de un campo F 
es un espacio vectorial, que denotaremos por P(F), bajo las siguientes 


operaciones: 


Para 


f(x) = anx” + anixi H... Ha 


glx) = bax” + baix +... +b, 
en P(F) y cEF, 


G + gx) = (An + by)x" + (Ana + bn +... + (a, + ba) 


(cf) (x) = Can X” -+ CAn xn + ... + Ca». 


Veremos en el ejercicio 21 de la sección 2.4 que el espacio vectorial 
que abajo se define es esencialmente el mismo que P(F). 


Ejemplo 5. El espacio de todas las sucesiones finitas no nulas en un 
campo F. 
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Sea F cualquier campo. Una sucesión en F es una función « de los 
enteros positivos en F. Como es usual, la sucesión ø tal que v(n) = an, 
se escribirá como (a,). El espacio vectorial V de todas las sucesiones 
finitas no nulas en F está integrado por todas las sucesiones {an} en F 
que solamente tienen un número finito de términos no nulos an. Si {an} 
y {ba} son sucesiones en V y t€ F, entonces {an} + {bn} es aquella 
sucesión (c,) en V tal que c, = a, + br(n= 1, 2, ...), y Han} es 
aquella sucesión (d,) en V tal que d, = ta,(n= 1, 2,...). 


Nuestros dos ejemplos siguientes contienen conjuntos en los que están 
definidos una suma y un producto por escalares pero no se trata de 
espacios vectoriales. 


Ejemplo 6. Sea S= ((a,, a,): as, az € R}. Para (a, a»), (b,, b-)ES 
y cE R, se definen 


(a,, a») + (ba, b2) = (a, + bi, a — ba) y c(a, a) = (ca, caz). 


Como (VS 1), (VS 2) y (VS 8) no se cumplen, S no es un espacio 
vectorial bajo estas operaciones. 


Ejemplo 7. Sea S como en el ejemplo 6. Para (a,, a»), (b,, b2) € $ y 
cE R, definimos 


(a,, a) + (bı, b2) = (a, + ba, 0) y c(a,, @) = (ca, 0). 


Luego, bajo estas operaciones, $ no es un espacio vectorial pues (VS 3) 
(y por tanto (VS 4)) y (VS 5) fallan. 


Esta sección concluirá con algunas de las consecuencias elementales 
de la definición de un espacio vectorial. 


Teorema 1.1 (Ley de cancelación para la suma vectorial). Si x, y y Zz son 
elementos de un espacio vectorial V tal que x + z= y + z, entonces 


x= y. 


DEMOSTRACIÓN. Existe un elemento v en V tal que z + v=0 (VS 4). 
Luego, x=x+0=x+(Z+V)= (2 +2) +4 v= (ytz) +V= y 
+ (z+v)=y+0= y por (VS 2) y (VS 3). E 


Corolario 1. El vector O descrito en (VS 3) es único. 


DEMOSTRACIÓN. Ejercicio. 


Corolario 2. El vector y descrito en (VS 4) es único. 


DEMOSTRACIÓN. Ejercicio. 
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El vector O descrito en (VS 3) se llama vector cero de V, y el vec- 
tor y descrito en (VS 4) (esto es, el vector único tal que x + y = 0) 
se llama el inverso aditivo de x y se denota por —x. 

El siguiente resultado contiene algunas de las propiedades elementales 
de la multiplicación por escalar. 


Teorema 1.2 En cualquier espacio vectorial V, son verdaderos los siguientes 
enunciados: 


(a) 0x =0 para toda x€ V. 
(b) (—a)x= —(ax) para toda a€ F y toda x€ V. 
(c) a0=0 para toda a€ F. 


DEMOSTRACIÓN: 
(a) Por (VS 8), (VS 1) y (VS 3) se tiene que 
Ox + Ox = (0.+ 0)x = Ox = O + Ox. 


Por tanto, 0x = 0 por el Teorema 1.1. 

(b) El elemento —(ax) es el único elemento de V tal que 
ax + [—(ax)] =0. Si ax + (—a)x = 0, el corolario 2 anterior impli- 
caría que (—ajx= —(ax). Pero por (VS 8), ax + (—a)x = [a + 
+ (—a)]x = 0x, y así ax+ (—a)x=0x=0 por (a). Entonces, 
(—a)x = — (ax). 

La demostración de (c) es semejante a la demostración de (a). E 


EJERCICIOS 


1. Determinar si las siguientes expresiones son falsas o verdaderas. 


(a) Todo espacio vectorial contiene un vector cero. 

(b) Un espacio vectorial puede tener más de un vector cero. 

(c) En cualquier espacio vectorial ax = bx implica que a= b. 

(d) En cualquier espacio vectorial ax = ay implica que x = y. 

(e) Un elemento de F* puede ser considerado como un elemento de 
Maa 0). 

(f) Una matriz de m x n tiene m columnas y n renglones. 

(g) En P(F) sólo se pueden sumar polinomios del mismo grado. 

(h) Si f y g son polinomios de grado n, entonces f + g es un polinomio 
de grado n. 

G) Si f es un polinomio de grado n y c es un escalar no nulo, entonces 
cf es un polinomio de grado r. 

G) Un elemento no nulo de F puede considerarse como un elemento de 
P(F) de grado O. 
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(k) Dos funciones en F(S, F) son iguales si y sólo si toman los mismos 
valores en cada punto de S. 


2. Escribir el vector nulo de Mixz4(F). 


3. Si 


¿cuáles son Mis, Ma, y Maz? 


4. Realizar las operaciones indicadas. 
(a) (2 5 -=3Y ,( 4 -2 5 
1 0 7 ( -5 3 2) 


(b) /—6 4 7 —5 
( 3 -2) + (e =3) 
1 8 2 0 


(c) 4/2 5 -3 
(o 7) 


6 4 
(d) 

-5 3 —2 

1 8 


(e) (2x — Te t 4x +3) + (8x + 2x — 6x + 7) 
(1D) (—3x + Tx + 8x — 6) + (2x? — 8x + 10) 
(g) 5Qx — 6xt + 8x? — 3x) 

(h) 3(x5 — 2x + 4x + 2) 


Los Ejercicios 5 y 6 muestran por qué las definiciones de suma y multiplica- 
ción por escalares de matrices (como se definen en el ejemplo 2) son las ade- 
cuadas. 


5. Richard Gard (Efectos de los castores en las truchas en Sagehen Creek, 
California. J. Wildlife Management, 25, 221-242) reporta el siguiente núme- 
ro de truchas que atravesaron las represas de castores en Sagehen Creek: 


Cruces a contracorriente 
Otoño Primavera Verano 
Trucha arroyo 


8 3 
Trucha arcoiris 3 0 0 
Trucha café 3 0 
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Cruces a favor de la corriente 


Otoño Primavera Verano 


Trucha arroyo 9 1 4 
Trucha arcoiris 3 0 0 
Trucha café 1 1 0 


Registrar los cruces a contracorriente y a favor de la corriente como 
datos en dos matrices de 3 x 3 y verificar que la suma de las dos matri- 
ces da el número total de cruces (a contracorriente y a favor) categorizada 
por especie de trucha y por estación. 


6. Al final de mayo, un almacén de muebles tenía el siguiente inventario: 


Americano Medite- 

tradicional Español rráneo Danés 
Conjuntos de sala 4 2 1 3 
Conjuntos de alcoba 5 1 1 4 
Conjuntos de comedor 3 1 2 6 


Registrar estos datos como una matriz M de 3 x 4. Con el fin de prepa- 
rarse para su venta de junio, el almacén decidió duplicar su inventario de 
cada uno de los rubros anteriores. Suponiendo que nada de la mercancía 
en inventario se vende hasta que los pedidos de muebles adicionales lleguen, 
se verifica que el inventario disponible después de recibir el pedido estará 
dado por la matriz 2M. Si el inventario al final de junio queda dado por 
la matriz 


553 1.2 
A=|6 2 1 5f 

1 0 3 3 
interpretar 2M — A. ¿Cuántos conjuntos se vendieron durante la venta de 
junio? 

7. Sea S= {0, 1) y F= R, el campo de los números reales. En F(S, R), 

demostrar que f = g y f + g = h donde f(x) = 2x + 1, g(x) = 1 + 4x — 
—2x?, y h(x) =5 +1. 


8. Demostrar que en cualquier espacio vectorial V, (a + b)(x + y) = ax + 
+ ay + bx + by para toda x, y€ V y cualquier a, b € F. 


9. Demostrar los Corolarios 1 y 2 del Teorema 1.1 y el Teorema 1.2(c). 


10. Sea V el conjunto de todas las funciones diferenciales de valores reales 
definidas sobre la recta de los reales. Demostrar que V es un espacio vecto- 


11. 


12. 


13. 


14. 


15. 


16. 


17. 
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rial bajo las operaciones de suma y multiplicación por escalares definidas 
en el ejemplo 3. 


Sea V = (0) que conste de un único vector O y defínase 0 + 0=0 y 
c0 = 0 para cada c de F. Demostrar que V es un espacio vectorial sobre 
F(V se llama el espacio vectorial cero). 


Una función de valor real definida sobre la recta de los reales se llama 
función par si f(—x) = f(x) para todo número real x. Demostrar que el 
conjunto de las funciones par definidas en la recta de los reales, con las 
operaciones de suma y multiplicación por escalares definidas en el ejem- 
plo 3, es un espacio vectorial. 


Sea V el conjunto de pares ordenados de números reales. Si (a,, a») 
y (bı, b2) son elementos de V y c es un elemento de F, se definen 


(a,, a.) + (b,, b:) = (a, + bı, ab) y c(a,, az) = (ca, a»). 


¿Es V un espacio vectorial bajo esas operaciones? Verifique su respuesta. 


Sea V = ((8,, ..., an): 41€ C para i= 1, 2,..., n}. ¿Es V un espacio 
vectorial sobre el campo de los números reales con las operaciones de suma 
y multiplicación con correspondencia de elementos? 


Sea V = { (a, ..., an): a; € R para i= 1, 2,..., n}. ¿Es V un espacio 
vectorial sobre el campo de los números complejos bajo las operaciones de 
suma y multiplicación con correspondencia de elementos? 


Sea V = ((a,, az): a,, a, € R}. Para (a,, a), (b,, b2) € V y CER, defí- 
nase 


(a,, a.) + (b,, b.) = (a, + b,, U> + b.) 


(0, 0) sic=0 
c(d, a.) = |(c s) si c Æ0. 


¿Es V un espacio vectorial bajo estas operaciones? Justifiqye su respuesta. 


Sea V = { (a, a.): as, a. € C}. Para (a,, a), (bi, db.) € V y CEC, de- 
fínase 


(ai, 42) + (b,, db.) = (a, + 2b,, a, + 3b.) y c(a, a.) = (ca,, ca.). 


¿Es V un espacio vectorial bajo estas operaciones? Justifique su respuesta. 
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Sea V = ((a,, az): as, az € F}, donde F es un campo arbitrario. Defí- 
nase la suma de los elementos de V elemento a elemento, y para c€ F 
y (a,, a,) € V, defínase 


c(a,, a.) = (a,, 0). 


¿Es V un espacio vectorial bajo estas operaciones? Justifique su respuesta. 


SUBESPACIOS 


Normalmente, en el estudio de cualquier estructura algebraica es intere- 
sante examinar subconjuntos que tengan la misma estructura que el con- 
junto que esté siendo considerado. Así, la noción apropiada de subestructu- 
ra para espacios vectoriales se introduce en esta sección. 


Definición. Un subconjunto W de un espacio vectorial V sobre un campo F 


se llama un subespacio de V si W es un espacio vectorial sobre F, bajo 
las operaciones de suma y multiplicación por escalares definidas en V. 


En cualquier espacio vectorial V, es de hacer notar que V y (0) son 
subespacios. Este último se denomina el subespacio cero de V. 


Afortunadamente, no es necesario verificar todas las condiciones sobre 
espacios vectoriales con el objeto de demostrar que un subconjunto W 
de un espacio vectorial V es en realidad un subespacio. Como se sabe, 
las condiciones (VS 1), (VS 2), (VS 5), (VS 6), (VS 7) y (VS 8) se 
satisfacen para los elementos de V, las cuales, automáticamente se cumplen 
también para los elementos de un subconjunto V. Entonces, un sub- 
conjunto W de V es un subespacio de V si y sólo si las siguientes cuatro 
condiciones se satisfacen: 


x + y € W siempre y cuando xE W y yE W. 

ax € W siempre que a€ F y x€ W. 

El vector cero de V pertenece a W. 

El inverso aditivo de cada elemento de W pertenece a W. 


PUNH 


En realidad, la condición 4 es redundante, como lo muestra el siguiente 
teorema. \ 


Teorema 1.3 Sea V un espacio vectorial y W un subconjunto de V. Entonces, 


W es un subespacio de V si y sólo si se satisfacen las tres condiciones 
siguientes: 


(a) 0E W. 
(b) x+y€ W siempre que XEW y yE W. 
(c) ax€ W siempre que a€ F y x€ W. 
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DEMOSTRACIÓN. Si W es un subespacio de V, entonces W es un espacio 
vectorial bajo las operaciones de suma y multiplicación por escalares defi- 
nidas en V. Tenemos entonces que se cumplen las condiciones (b) y (c), 
y existe un elemento 0' € W tal que x+ 0'= x para toda x€ W. Pero 
también x + 0 = x, y por tanto 0' = 0 por el Teorema 1.1. Luego enton- 
ces, también se satisface la condición (a). 


Recíprocamente, si se satisfacen las condiciones (a), (b) y (c), la 
exposición que precede a este teorema muestra que W puede ser un 
subespacio de V si el inverso aditivo de cada elemento de W pertenece 
a W. Pero si x€ W, entonces (—1)x pertenece a W por la condición 
(c), y ~x = (—1)x por el Teorema 1.2. De aquí que W sea un subes- 
pacio de V. B 


El teorema anterior proporciona un método sencillo para determinar 
si un subconjunto dado de un espacio vectorial es o no realmente un 
subespacio. En general, este resultado es el que se emplea para demostrar 
que un cierto subconjunto es un subespacio. 

La transpuesta M’ de una matriz M de m x n es la matriz de n x m 
obtenida a partir de M mediante el intercambio de renglones con colum- 
nas; esto es (M*)i; = Mji. Por ejemplo, 


pas age Kog 
l 5 J [2 a 
E 3 i 


Una matriz simétrica es una matriz M tal que M' = M. Evidentemente, 
una matriz simétrica debe ser cuadrada. El conjunto W de todas las matri- 
ces simétricas en Mnxn(F) es un subespacio de Maxn(F) ya que se satis- 
facen las condiciones del Teorema 1.3: 


(a) La matriz cero es igual a su transpuesta y, por tanto, pertene- 
ce a W. 


Puede probarse fácilmente que para matrices Æ y B y para escalares a 
y b cualesquiera, (a4 + bB)' = aA' + bB*, (Ver el ejercicio 3.) Usando 
este hecho, se pueden establecer fácilmente las condiciones (b) y (c) 
del Teorema 1.3 de la manera siguiente: 


(b) Si AEW y BEW, entonces A = de y B = Bt. Ahora bien, 
(A+ B)'= At + B'=A +B, de manera que A + B€ W. 

(c) Si A € W, entonces At = A. Luego, para toda a€ F, (aA)' = 
= agA*t = aA. Y así aA € W. 


Los siguientes ejemplos proporcionan más ilustraciones del concepto 
de subespacio. Los primeros tres son particularmente importantes. 
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Ejemplo 8. Las matrices diagonales en Maxn(F). 


Sea M una matriz de n x n. La diagonal (principal) de M consta de 


los términos M,,, Mas, ... , Man. Una matriz D de n x n se llama matriz 
diagonal si todos los valores que no se encuentren sobre la diagonal de D 
son nulos, esto es, si D;; = O para toda ¿+j. El conjunto de todas las 


matrices diagonales en Mn. (F) es un subespacio de Mn (F). 


Ejemplo 9. Los polinomios de grado menor o igual a n. 


Sea n un entero no negativo y sea P.(F) un conjunto que consista 
de todos los polinomios en P(F) que tengan grado menor o igual a n. 
(Nótese que el polinomio nulo es un elemento de P,(F) pues su grado 
es —1.) Luego entonces, P,(F) es un subespacio de P(F). 


Ejemplo 10. Las funciones continuas de valores reales definidas en el 
eje de los reales R. 


El conjunto C(R) formado por todas las funciones continuas de valor 
real definidas en R es un subespacio de F(R, R), donde F(R, R) es tal 
como se definió en el ejemplo 3. 


Ejemplo 11. La traza de una matriz M de n x n, denotada por tr(M), 
es la suma de los valores de M ubicados en la diagonal; esto es, tr(M) = 
= Mi + Ma +... + Man. El conjunto de todas las matrices de n x n 
que tienen una traza igual a cero es un subespacio de Maxn(F). (Ver el 
ejercicio 6.) 


Ejemplo 12. El conjunto de matrices en Mmxn(F) que únicamente ten- 
gan elementos no negativos no es un subespacio de Mm xn(F) ya que no 
se cumple la condición (c) del Teorema 1.3. 


Los dos teoremas siguientes proporcionan métodos para formar subes- 
pacios a partir de otros subespacios. 


Teorema 1.4 Cualquier intersección de subespacios de un espacio vectorial V 
es un subespacio de V. 


DEMOSTRACIÓN. Sea C un conjunto de subespacios de V y sea W la inter- 
sección de todos los subespacios en €. Como cada uno de los subespacios 
contiene al vector cero, 0 € W. Sean a€ F y x, y elementos de W; enton- 
ces x y y son elementos de cada subespacio en C. De aquí concluimos que 
x + y y ax son elementos de cada subespacio en € (porque la suma de 
vectores en un subespacio y el producto de un escalar y un vector del 
subespacio, ambos pertenecen a ese subespacio). Entonces x + y € W 
y ax€ W; luego entonces W es un subespacio de acuerdo con el Teore- 
ma 1.3. B 
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Habiendo demostrado que la intersección de subespacios es un subes- 
pacio es lógico considerar la cuestión de si la unión de subespacios es 
o no un subespacio. Se puede ver fácilmente que la unión de subespacios 
debe satisfacer las condiciones (a) y (c) del Teorema 1.3 pero no nece- 
sariamente satisface la condición (b). De hecho, se puede demostrar de 
inmediato (ver ejercicio 18) que la unión de dos subespacios es un subes- 
pacio si y sólo si uno de los subespacios es un subconjunto de otro. Es 
normal, sin embargo, pensar que debería de existir un método para combi- 
nar ambos subespacios W, y W. para obtener un subespacio mayor (o 
sea, uno que contenga a W, y a W.). Como sugerimos anteriormente, 
la clave para encontrar tal subespacio es la condición (b) del Teorema 
1.3. Esta observación sugiere que debiéramos considerar la “suma” de 
dos subespacios (como se define a continuación). 


Definición. Si S, y S. son dos subconjuntos no vacíos de un espacio vectorial V, 
entonces la suma de S, y S», que se expresa como S, + S», es el conjunto 
{x + y: xE S, y y€ S,). La suma de cualquier número finito de subcon- 


juntos no vacios de V, S,, ... , Sa, se define análogamente como el con- 
junto 
Si+... HSS {xatna X CES parai= 1, ER i 


Teorema 1.5 Si W, y Wa son subespacios de un espacio vectorial V, entonces 
W, + W: es un subespacio de V. 


DEMOSTRACIÓN. Sean W, y W., subespacios de V. Como 0€ W, y 
0€ W., 0=0+0€ W, + Wa. Sea ac F y x, yE W, + Wa; entonces 
existirá xı, y, € Wi y xX; y» € Wo tales que X= xi + X2 Y y =y +yz 
Ahora bien, 

xty= (x tx) + (y +y) = (xa ty) + (x2 + yə) 
es un elemento de W, + W, ya que x, + y, € W, y x + y2€ Wa, y 


ax = alx, + x) = ax, + ax, 


es un elemento de W, + W, ya que ax, € W, y ax; € W.. Luego enton- 
ces W, + W: es, por el Teorema 1.3, un subespacio de V. I 


Corolario. La suma de cualquier número finito de subespacios de V es un 
subespacio de V. 


Una clase especial de suma jugará un papel importante en los capítulos 
siguientes. Introduciremos un caso especial de'este concepto en la siguiente 
definición. 
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Definición. Se dice que un espacio vectorial V es la suma directa de W, y W., 
expresada como V = W, @® Wa, si W, y Wa son subespacios de V tales 
que W, ONW: = {0 y W, + W. =V. 


Ejemplo 13. Sea W, = {(a, 0): a€ F} y W¿.=((0, b): bEeF). 
Luego, F = W, Q W.. 


Ejemplo 14. Una función g de valor real definida en R se llama función 
par si g(—x) = g(x) para toda x€ R y se llama función impar si 
g(—x) = —g(x) para toda x€R. Sean W, y W., respectivamente, los 
conjuntos de todas las funciones pares e impares en F(R, R). 

Demostraremos que F(R, R) = W, @ W.. Puede verse fácilmente que 
W, y W: son subespacios de F(R, R). (Ver Ejercicio 19.) Supóngase que 
g€ W, N Wa; entonces g es al mismo tiempo una función par e impar. 
Así g(—x) = g(x) y g(—x) = —g(x) para cada x€ R y, por lo tanto, 
g es la función cero. Por lo tanto, W, N W: = (0). Sea fEF(R, R), y 
defínase g, h€ F(R, R) como g(x) = 4[f(x) + f(—x)] y h(x) = 
= 4[f(x) — f(—x)]. Entonces g es una función par y h es una función 
impar tales que f =g + h. De aquí que f€ W, + We. Como f es un 
elemento arbitrario de F(R, R), se tiene que F(R, R) = W, + W.. Esto 
es, F(R, R) es la suma directa de W, y W.. 

Si W, y Wa son subespacios de un espacio vectorial V tales que 
W, + We = V, entonces, cada elemento de V puede expresarse como la 
suma de un elemento x, en W, y un elemento x, en W,. Es posible que 
puedan existir muchas representaciones semejantes, es decir, que xı y x3 
no sean únicas. Por ejemplo, si 


W, = [(a,, a,, as) € F: as= 0) 


W: = [(a,, a», aa) € FP: a = 0), 


claramente W, + W. = F*. De hecho, para cada c€ F, (b,, ba, bi) = 
= (b,, be +c, 0) + (0, —c, b) es una representación de (b,, bz, bs) 
como la suma de un elemento (b,, be +c, 0) en W, y un elemento 
(0, —c, b¿) en Wo. Así, en este ejemplo la representación de los elemen- 
tos de F? como las sumas de un elemento en W, y un elemento en W- 
no es única. Nuestro próximo resultado determina cuándo existe este tipo 
de unicidad. 


Teorema 1.6 Sean W, y W- subespacios de un espacio vectorial V. Entonces 
V es la suma directa de W, y Wa si y sólo si cada elemento de V puede 
ser escrito de manera única como X, + Xx, donde x, € W, y X. € Wo. 


DEMOSTRACIÓN. Supóngase que V = W@W.. Como V=W,+V', 
cada elemento de V puede ser expresado como la suma de vectores en W, 
y W.. Supóngase que algún elemento z en V puede ser escrito como 
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z = X1 +X: y también como z = y, + ys, donde Xi, YE Wi y Xo yo € Wo. 
Entonces, x, + x = y, + y» y así xı — yı = yo — x.. Ahora bien, x, — 
— yı C W, puesto que x, y y, son elementos de W,, y análogamente 
Y: — X2€ Wo. Pero como x,— y, = y» — xə se deduce que xı — y, = 
= Ya — XxE€ W, NAW = {0}. 

Por lo tanto, x, — y, = ys — x = 0, y así x, = y, y X = yz, lo que 
demuestra la unicidad de la representación de z como la suma de un ele- 
mento de W, y un elemento de W.. 

La demostración de la proposición recíproca se deja al lector como 
ejercicio. $ 


EJERCICIOS 
1. Decir si las siguientes proposiciones son verdaderas o falsas. 


(a) Si V es un espacio vectorial y W es subconjunto de V que es también 
un espacio vectorial, entonces W es un subespacio de V. 

(b) El conjunto vacío es un subespacio de todo espacio vectorial. 

(c) Si V es un espacio vectorial distinto del espacio vectorial cero (0), 
entonces V contiene un subespacio W tal que W > V. 

(d) La suma de dos subconjuntos cualesquiera de V es un subespacio 
de V. 

(e) Una matriz diagonal n x m no puede tener más de n términos no 
nulos. 

(f) La traza de una matriz cuadrada es el producto de sus términos que 
se encuentran sobre la diagonal. 


2. Determinar la transpuesta de cada una de las siguientes matrices. Además, 
si la matriz es cuadrada, calcular su traza. 


(a) (4 2 (b) /0 8 —6 
5 3) l 4 ») 
c) /-3 9 (d) /10 0 —8 
0 —2 2 —4 
6 1 —5 7 
(e) (l, —1, 3, 5) © /—2 51 4 
( 701 e) 
(8) /5 (h) /-4 0 6 
6 0 1 -3 
7 6-3 5 


3. Demostrar que (aA + bB)! = a4! + bB* para toda A, BE Mmxa(F) y 
toda a, bE F. 
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10. 


11. 


12. 


13. 


14. 


16. 


17. 
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Demostrar que (4t)! = A para toda A € Mmxn(F). 
Demostrar que A + At es simétrica para cualquier matriz cuadrada A. 


Demostrar que  tr(aA + bB) =atr(A4A) + btr(B) para toda A, 
B € Muxa (F). 


Demostrar que las matrices diagonales son matrices simétricas. 


Verificar que los siguientes conjuntos son subespacios de R? bajo las opera- 
ciones de suma y multiplicación por escalares definidas en R. 


(a) W, = [ (a, Az, az) € R3: ar = 3a, y Ag Z — a») 
(b) Wo = [(a,, A2, az) € R3: 2a + a», + Saz = 0} 
(c) W = { (a, 4», 43) € R$: a, — 4a: — a; = 0} 


Sean W,, W., y W, como en el ejercicio 8. Describir W, N W., W- N Wa, 
y W, O W; y obsérvese que cada una es subespacio de Rè. 


Verificar que W, = ([(a,, .. , an) E F": a+... + an = 0) es un subes- 
pacio de F” pero que W: = ((4,, ..., An) E F: a+... +a, = 1) no 
lo es. 


¿Es el conjunto W = {f€ P(F): f=0 o f tiene grado n} un subes- 
pacio de P(F) si n > 1? Justifique su respuesta. 


Una matriz A de m x n se llama triangular superior si todos los términos 
ubicados por debajo de la diagonal valen cero, esto es, A;¡;= O siempre 
que į > j. Verificar que las matrices triangulares superiores forman un sub- 
espacio de Mmxn (F). 


Verificar que para cualquier so € S, W = {f€ F(S, F): f(s) = 0) es un 
subespacio de F(S, F). 


¿Es el conjunto de todas las funciones diferenciales de valores reales defi- 
nidas en R un subespacio de C(R)? Justifique su respuesta. 


Sea C”(R) el conjunto de todas las funciones de valor real definidas en 
la recta de los reales que tiene una derivada n-ésima continua (y, por tanto, 
derivadas continuas de orden 1, 2,... , n). Verificar que C"(R) es un 
subespacio de F(R, R). 


Demostrar que un subconjunto W de un espacio vectorial V es un subes- 
pacio de V si y sólo si W Y y ax€ W y x + y€ W siempre que 
ae F y x, yEW. 


Demostrar que un subconjunto W de un espacio vectorial V es un subes- 
pacio de V si y sólo si 0 € W y ax + y € W siempre que a€ F y x, y EW. 


19. 


20. 


21. 


22. 


23. 


24.* 


25. 
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Sean W, y W. subespacios de un espacio vectorial V. Demostrar que 
W,'U We es un subespacio de V si y sólo si W, C W: o W: C W.. 


Sean F, y F; campos. Una función g € F(F,, F») se lama función par si 
g(—x) = g(x) para toda x€ F, y se llama función impar si g(—x) = 
= —g(x) para toda x€ F,. Demostrar que el conjunto de todas las fun- 
ciones pares en F(F,, F,) y el conjunto de todas las funciones impares en 
F(F,, F2) son subespacios de F(F,, Fe). 


Mostrar que F" es la suma directa de los subespacios 


Wi = ([(41, ..., an) EF: an = 0} 
We = {(@n..., n) EP a=... = ar = 0}. 


Sea W, el conjunto de polinomios f en P(F) tales que f(x) = 0 o, en la 
representación 


f(x) = apx” Ha + ... +0, 


los coeficientes ao, a», 4,, ... de todas las potencias pares de x son iguales 
a cero. Análogamente, sea Wz el conjunto de todos los polinomios g en 
P(F) tales que g(x) = 0 o, en la representación 


glx) = bmx” + bmx" + ... + bo, 


los coeficientes b,, bs, bs, ... de todas las potencias impares de x son 
iguales a cero. Demostrar que P(F) = W, @ W.. 


Sea W, = {4 € Mmxn (F): Ai; = O0 cuando i > j} y Wa = [A€ Mmxn(F): 
Ai; = O cuando į < j}. (W, es el conjunto de las matrices triangulares supe- 
riores definidas en el ejercicio 12.) Demostrar que Mmxn(F) = W, @ W.. 


Sea V el espacio vectorial formado por todas las matrices triangulares supe- 
riores de n x n (como se definieron en el ejercicio 12), y sea W, el 
subespacio de V formado por todas las matrices diagonales. Demostrar que 
V =W @W., donde W, = {4€ V: 4;;=0 cuando i< j}. 


Demostrar que si W es un subespacio de V y x,,..., x, son elementos 


de W, entonces axı + ... + ax, es un elemento de W para cualesquie- 
ra escalares a,, ..., a, en F. 


Una matriz M se llama antisimétrica si M' = —M. Evidentemente una 
matriz antisimétrica es cuadrada. Demostrar que el conjunto de todas las 
matrices antisimétricas de n x n es un subespacio W, de M,,»(R). Sea 
W. el subespacio de M,,,(R) consistente de las matrices simétricas de 
n x n. Demostrar que Maxn(R) = W: a W.. 


* En otras secciones del libro haremos referencia a los problemas marcados 


con asterisco (*). 
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26. 


27. 


28. 


29. 
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Sea W, = (A € Mnxn(F): Ai; =0 cuando i< j} y sea W: el conjunto 
de matrices simétricas de n x n. W, y We son ambos subespacios de 
Maxn(F). Demostrar que Maxn(F) = W, @ Wo. Compárense los ejerci- 
cios 25 y 26. 


Demostrar el corolario del Teorema 1.5. 
Completar la demostración del Teorema 1.6. 


Sea W un subespacio de un espacio vectorial V sobre un campo F. Para 
toda veV el conjunto {v} +W = {v +w: wEW) se llama co-conjun- 
to de W que contiene a v. Es frecuente expresar este co-conjunto como 
v +W en vez de {v} + W. Demostrar lo siguiente: 


(a) v +W es un subespacio de V si y sólo si v € W. 
(b) vı + W= va +W si y sólo si v — Ve € W. 


La suma y el producto por elementos de F puede definirse en el conjunto 
S= {v +W: v€ V} de todos los co-conjuntos de W como sigue: 


(vı + W) + (v, + W) = (v, + va) + W 
para toda v,, EV y 
alv + W) =av+ W 
para toda vE V y a€ F. 
(c) Demostrar que las operaciones anteriores están bien definidas; es 


decir, mostrar que si v +W =v, + W y v + W= v + W, en- 
tonces 


(vı +W) + (v +W) = (v +W) + (Y +W) 


alv, + W) = a(v, + W) 


para toda a€ F. 

(d) Demostrar que el conjunto S es un espacio vectorial bajo las opera- 
ciones definidas anteriormente. Este espacio vectorial se llama espacio 
cociente de V módulo W y se expresa mediante V/W. 


COMBINACIONES LINEALES Y SISTEMAS 
DE ECUACIONES LINEALES 


En la sección 1.1 se mostró que la ecuación del plano que pasa por tres 
puntos no colineales P, Q y R en el espacio es x = P + fu + tev, donde 
u y v son los vectores que parten del origen y terminan, respectivamente, 
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en Q y R, y f y t son números reales cualesquiera. Un caso especial 
importante ocurre cuando P es el origen. En este caso la ecuación del 
plano se simplifica a x = tu + təv, y el conjunto de todos los puntos conte- 
nidos en este plano es un subespacio de R?. (Esto se demostrará como 
el Teorema 1.7 de esta sección.) Expresiones de la forma t,u + tav donde 
li y t son escalares y u y v vectores, juegan un papel primordial en la 
teoría de los espacios vectoriales. La generalización apropiada de tales 
expresiones se expresa en la siguiente definición. 


Definición. Sea V un espacio vectorial y S un conjunto no vacío de V. Se dice 
que un vector x de V es una combinación lineal de elementos de S, si 


existe un número finito de elementos yı, ... , yn en S y escalares ai, ... , an 
en F tales que x= ay, + ... + Anyn. En este caso, es común decir que 
x es una combinación lineal de y,, ... , yn. 


Obsérvese que en cualquier espacio vectorial V, Ox = 0 para toda 
x€ V. Luego, el vector cero es una combinación lineal de cualquier sub- 
conjunto no vacío de V. 


Ejemplo 15. La tabla 1.1 muestra el contenido vitamínico de 100 gra- 


mos de 12 alimentos con respecto a vitaminas A, B, (tiamina), B; (ribo- 
flavina), niacina y C (ácido ascórbico). 


TABLA 1.1 Contenido de vitaminas de 100 gramos de algunos alimentos 


A 
(unida- B, B, Niacina C 
des) (mg) (mg) (mg) (mg) 
Compota de manzana 0 0.01 0.02 0.2 2 
Manzanas frescas (recién cortadas) 90 0.03 0.02 0.1 4 
Dulce relleno de coco y cubierto de 
chocolate 0 0.02 0.07 0.2 0 
Almejas (únicamente la carne) 100 0.10 0.18 1.3 10 
Pastel de molde de masa 0 0.05 0.06 0.3 0 
Féculas cocidas (no enriquecidas) (0)* 0.01 0.01 0.1 (0) 
Jaleas y conservas 10 0.01 0.03 0.2 2 
Tarta de natillas de coco (horneada 
con harina) 0 0.02 0.02 0.4 0 
Arroz café crudo (0) 0.34 0.05 4.7 (0) 
Salsa de soya 0 0.02 0.25 0.4 0 
Spaghetti horneado (no enriquecido) 0 0.01 0.01 0.3 0 
Arroz silvestre crudo (0) 0.45 0.63 6.2 (0) 


* Los ceros entre paréntesis indican que la cantidad de vitamina presente es 
casi nula o demasiado pequeña para medirse. 


FUENTE: Composición de alimentos (Manual ‘de Agricultura Número 8) por Berni- 
ce K. Watt y Annabel L. Merrill. División de Invéstigación. de. Ja Economía y Ali- 
mentación del Sje Departamento..de Agricultura de los Estados Unidos, 


pee a O a e a 
Fao, oa n aS h? A -CAS 
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Registraremos el contenido vitamínico de 100 gramos de cada alimento 
como un vector columna en R*—por ejemplo, el vector vitamínico para 
la compota de manzana es 


0.00 
0.01 
0.02 |. 
0.20 
2.00 


Considerando los vectores vitamínicos para el pastel de molde, la tarta 
de natillas de coco, el arroz café, la salsa de soya y el arroz silvestre, se 
ve que 


0.00 0.00 0.00 0.00 0.00 
0.05 0.02 0.34 0.02 0.45 
0.06| + |0.02| + [0.05| + 210.25 į = | 0.63]. 
0.30 0.40 4.70 0.40 6.20 
0.00. 0.00 0.00 0.00 0.00 


Luego, el vector vitamínico para el arroz silvestre crudo es una combi- 
nación lineal de los vectores de vitaminas para el pastel de molde, tarta 
de natillas de coco, arroz café crudo y salsa de soya. Así, 100 gramos de 
pastel de molde, 100 gramos de tarta de natillas de coco, 100 gramos 
de arroz café crudo y 200 gramos de salsa de soya proporcionan exacta- 
mente las mismas cantidades de las 5 vitaminas que 100 gramos de arroz 
silvestre crudo. De una manera análoga, como 


0.00 90.00 0.00 0.00 10.00 0.00 100.00 


0.01 0.03 0.02 0.01 0.01 0.01 0.10 
210.02] + | 0.02] + [0.07| + |0.01| + | 0.03| + [0.01] =| 0.18], 
0.20 0.10 0.20 0.10 0.20 0.30 1.30 
2.00 4.00 0.00 0.00 2.00 0.00 10.00 


200 gramos de compota de manzana, 100 gramos de manzanas frescas, 
100 gramos de dulce de chocolate, 100 gramos de féculas, 100 gramos 
de jalea y 100 gramos de spaghetti proporcionan exactamente las mismas 
cantidades de las 5 vitaminas que 100 gramos de almejas. 


A través de los capítulos 1 y 2 se encontrarán muchas situaciones 
diferentes en las cuales será necesario determinar si un vector puede ser 
expresado como una combinación lineal de otros vectores. El cómo es 
posible hacerlo se reduce a un problema de solución de un sistema de 
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ecuaciones lineales. llustraremos esta importante técnica determinando 
si el vector (8, 15, 15, 12) en R* puede escribirse como una combinación 
lineal de y, = (1, 2, 1, 2), ye = (—2, —4, —2, -4), y, = (1, 4, 2, ©), 
ya = (2, 7, 5, 0), y ys = (3, 7, 2, 6). Por tanto, deberemos determinar 
si existen escalares a,, az, 43, A, y as tales que 


(8,15, 15, 12)= ayı + a.y. + As3Yy T Ayı + aY; 
=a (1l, 2, 1, 2) + æ(—2, —4, —2, —4) + ax(1, 4, 2, 0) 
+ a(2, 7, 5, 0) + a:(3, 7,2, 6) 
= (a, E 2a, + Aa + 24, + 3as, 24, == 4a» + 4a, 
+ Ta, + 7a;, a, — 2a, + 2a; + Sa, + las, 
2a, — 4a, + 6a;). 


Se puede ver ahora fácilmente que (8, 15, 15, 12) puede ser expresado 
como una combinación lineal de y,, y», ys, Ya y Ys, si y sólo si existen esca- 
lares (a,, a, 43, a,, as) que satisfacen el sistema de ecuaciones lineales 


a, — 2a, + a, + 2,+3a,= 8 
2a, — 4a, + 4a, + Ta, + 7a; = 15 
a, — 2a, + 2a, + 5a, + 2a; = 15 
2a, — 4a, + 6a, = 12 


(1) 


que se obtuvo igualando las coordenadas correspondientes de la ecuación 
anterior. 

Para resolver el sistema de ecuaciones (1) se substituirá éste por otro 
que tenga las mismas soluciones pero que sea mucho más sencillo de 
resolver. El procedimiento que utilizaremos expresará algunas de las in- 
cógnitas en términos de otras eliminando algunas de ellas en todas las 
ecuaciones, menos en una. Para empezar, eliminemos a, de la segunda, 
tercera y cuarta ecuaciones del sistema (1). Esta eliminación puede reali- 
zarse sumando —2 veces la primera ecuación a la segunda, —1 vez la 
primera ecuación a la tercera y —2 veces la primera ecuación a la cuarta; 
el resultado será el nuevo sistema 


a, — 2a, + a, + 2a, + 3a; = 8 
2a, + 3a, + as=-—l 

a; + 3a, — a= 7 

—2a, — 4a, = —4 


(2) 


en el cual se han eliminado a, y az en todas las ecuaciones, excepto en 
la primera. Continuando con el sistema de ecuaciones (2), agregaremos 
múltiplos de la segunda ecuación a las otras con objeto de eliminar a, 
de las ecuaciones menos en la segunda. En este caso debemos sumar —+ 
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veces la segunda ecuación a la primera para eliminar a, de ésta. Nótese, 
sin embargo, que si se intercambian la segunda y la tercera ecuaciones, 
los cálculos necesarios se simplifican. Entonces, intercambiaremos la se- 
gunda y tercera ecuaciones del sistema (2) para obtener 


a, — 2a, + a, + 2a,+3a5= 8 
a, + 3a, — a= 7 
2a, + 3a, + as=-—l 

—2a, — 4a, = —4. 


(3) 


Ahora, sumando —1 veces la segunda ecuación a la primera, —2 veces la 
segunda ecuación a la tercera y 2 veces la segunda ecuación a la cuarta, 
el sistema de ecuaciones (3) se transforma en 


a, — 2a, — a, + 4a, = 1 
a; + 3a, — as= 7 

—3a, + 3a; = —15 

2a, — 2a; = 10. 


(4) 


A continuación debemos sumar múltiplos de la tercera ecuación a las otras 
con objeto de eliminar a, en cada una de las ecuaciones del sistema (4), 
excepto en la tercera. De nuevo, los cálculos se simplifican si se realiza 
una operación preliminar—multiplicar la tercera ecuación por —3. 
Esto da 


a, — 2a, q 44 + 4a; = 
as + 3a, — As = 
5 
e dez (5) 
244 — 2a; = 10. 


Por último, en el sistema (5) añadamos 1 vez la tercera ecuación a la 
primera, —3 veces la tercera ecuación a la segunda y —2 veces la tercera 
ecuación a la cuarta para obtener 


a, — 2a, +3a,= 6 
a + 2a; = —8 

a4 — a= 5 

0= 0 


(6) 


El sistema de ecuaciones (6) es un sistema de la forma deseada: es fá- 
cil de resolver para a,, a, y a, (las incógnitas que aparecen como primera 
incógnita presente en alguna de las ecuaciones) en términos de otras incóg- 
nitas (a. y as). Escribiendo de nuevo el sistema (6), encontramos que 
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a; RF 2a z= 3a; + 6 
— 2a, — 8 
a, = as +5 


[l 


a3 


Entonces, para cualquier selección de los escalares a y a;, un vector de 
la forma 


(a, A», 43, Ga, as) 
= (2a: — 3a; + 6, æ, —2a; — 8, a, + 5, as) 
= a2(2, 1, 0, 0, 0) + as(—3, 0, —2, 1, 1) + (6, 0, —8, 5, 0) 


será solución del sistema original de ecuaciones (1). En particular, el 
vector (6, 0. —8, 5, 0) obtenido al hacer a. = 0 y as = 0 es una solu- 
ción del sistema (1). Entonces, 


(8, 15, 15, 12) = 6y, + Oy, — 8ya + Sy, + Oys, 


de manera que (8, 15, 15, 12) es una combinación lineal de Yis Ya Y3 
Ys Y Ys- 

El procedimiento que acabamos de ilustrar puede utilizarse para resol- 
ver cualquier sistema de ecuaciones lineales. Obsérvese que se utilizaron 
tres tipos de operaciones para resolver el sistema original. 


1. Intercambio del orden de cualquier par de ecuaciones en el sis- 
tema. 

2. Multiplicación de cualquier ecuación por una constante no nula. 

3. Suma de cualquier múltiplo constante de una ecuación a otra. 


Estas operaciones se utilizaron hasta obtener un sistema de ecuaciones 
con las siguientes propiedades: 


1. El primer coeficiente no nulo de cualquier ecuación es uno. 

2. Si una incógnita es la primera con coeficiente no nulo en alguna 
ecuación, entonces dicha incógnita aparece con un coeficiente nulo 
en cada una de las otras ecuaciones. 

3. La primera incógnita con coeficiente no nulo en cualquier ecua- 
ción tiene subíndice mayor que el de la primera incógnita con 
coeficiente no nulo en cualquier ecuación precedente. 


Para ayudar a aclarar el significado de estas propiedades, nótese que nin- 
guno de los siguientes sistemas satisface estas condiciones. 
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k + 3x, is 7 D 
2x3 — 5x, = —1 
xXı — 2x, + 3%, + x, =—5 
X, “==> 9 (8) 
X4 + 3x, = 6 
Xy —2x + xs=1 
X4 m 6x, FE 0 (9) 


X2 + 5X3 — 3x, = 2 


Específicamente, el sistema de ecuaciones (7) no satisface la condición 1 
porque el primer coeficiente no nulo de la segunda ecuación es 2; el 
sistema de ecuaciones (8) no satisface la condición 2 porque x, la prime- 
ra incógnita con coeficiente no nulo de la segunda ecuación, aparece con 
coeficiente no nulo en la primera ecuación; y el sistema de ecuaciones 
(9) no satisface la condición 3 porque x, la primera incógnita con 
coeficiente no nulo de la tercera ecuación, no tiene un subíndice mayor 
que x, la primera incógnita con coeficiente no nulo de la segunda 
ecuación. 


Una vez que se ha obtenido un sistema en el que se satisfacen las 
propiedades 1, 2 y 3, es fácil de resolver para algunas de las incógnitas 
en términos de las otras (como en el ejemplo anterior). Sin embargo, si 
en el curso de la ejecución de las operaciones 1, 2 y 3 se obtuviera un 
sistema que tuviera una ecuación de la forma 0 = c, donde c no es nula, 
entonces el sistema original no tiene soluciones, (Ver el ejemplo 16 a 
continuación. ) 

Regresaremos al estudio de sistemas de ecuaciones lineales en el capí- 
tulo 3. Al mismo tiempo, expondremos las bases teóricas para este método 
de solución de sistemas de ecuaciones lineales y su simplificación posterior 
mediante el uso de las matrices. 


Ejemplo 16. Demostraremos que 
2x — 2x? + 12x — 6 
es una combinación lineal de 
x? — 2x? — 5x3 y 3 — 5x — 4x-9 


en P¿(R) pero que 
3x? — 2 + 7x +8 


no lo es. En el primer caso deseamos encontrar escalares a y b tales que 


2x? — 2x? + 12x — 6 = a(x? — 2x? — 5x — 3) + b(3x* — 5x? — 4x — 9) 
= (a + 3b)x* + (—2a — 5b)x? + (—Sa — 4b)x + (—3a — 9b). 
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Esto nos lleva a establecer el siguiente sistema de ecuaciones lineales: 


a+3b= 2 
—2a — 5b = —2 
—5a — 4b = 12 
—3a — 9b = —6. 


Sumando múltiplos adecuados de la primera ecuación a las otras para 
eliminar a, encontramos 


a+ 3b= 2 
b= 2 
115 = 22 
0= 0. 


Ahora, sumando múltiplos adecuados de la segunda ecuación a las demás 
se tendrá 


a =-—4 
b= 2 
0= 0 
0 0. 


Por lo tanto, 


2x1 — 2x + 12x — 6 = —4(x — 21? — 5x — 3) 
+ 2(3x — 5x? — 4x — 9). 


En el segundo caso deseamos mostrar que no existen escalares a y b 
para los cuales 


3x — 2x? + 7x + 8 = a(x — 2x? — 5x — 3) 
+ b(3x* — 5x? — 4x — 9). 


Como en el caso anterior, obtenemos un sistema de ecuaciones lineales 


a+Bb= 3 
—2q — 5b = — 
a — 5b 2 (10) 
—5a — 4b = 7 
—3a — 9b = 8. 


Eliminando a, al igual que antes, se tiene 


a+ 3b= 3 
= 4 
Ilb = 22 


0=17. 
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Pero la presencia de la ecuación inconsistente 0 = 17 indica que el siste- 
ma de ecuaciones (10) no tiene soluciones y, por tanto, 3x? — 2x? + 7x + 
+ 8 no es una combinación lineal de x? — 2x? — 5x — 3 y 3x3 — 5x? — 
= 40 ==, 


El conjunto de combinaciones lineales de los elementos de un subcon- 
junto no vacío de un espacio vectorial proporciona otro ejemplo de subes- 
pacio, como lo muestra el siguiente resultado. 


Teorema 1.7. SiS es un subconjunto no vacío de un espacio vectorial V, enton- 
ces el conjunto W, integrado por todas las combinaciones lineales de ele- 
mentos de S, es un subespacio de V más pequeño que contiene a S en el 
sentido de que W es un subconjunto de cualquier subespacio de V que 
contiene a S. 


DEMOSTRACIÓN. Primero, emplearemos el Teorema 1.3 para probar que 
W es un subespacio de V. Como S- Ø, al menos 0 € W. Si y y z son 
elementos de W, entonces y y z son combinaciones lineales de elementos 


de S, de manera que existen elementos xı, ..., Xn Y Wi... , Wm en S 
tales que y = axı +... + anXn y z = biw, +... + bmWm para alguna 
selección de escalares a, ... , An y b,,... , bm. Ahora bien, 


y EZ AX t ... F anXn t biwi +... + bmWm 


CY = CA t... H CA 


son combinaciones lineales de elementos de S; luego entonces y + z y 
cy son elementos de W para cualquier c. Así, tenemos que W es un subes- 
pacio de V. 

Ahora bien, sea W’ cualquier subespacio de V que contenga a S. Si y 
es un elemento de W, entonces y es una combinación lineal de elementos 


de $ —digamos y = ax, + ... + @nXn, donde a, ..., an EF V Aue 
Xn € S. Puesto que S C W', Xi, ... , Xn E W”. Luego entonces y = a,x, + 
+... F px, es un elemento de W’, de acuerdo con el ejercicio 24 de la 


sección 1.3. Como y, un elemento arbitrario de W, pertenece a W’, 
W C W'. Esto completa la demostración. MM 


Definición. Al subespacio W descrito en el Teorema 1.7 se le llama subespacio 
generado por los elementos de S y se denota por L(S). Por conveniencia, 
definiremos L( Ø) = (0). 


Obsérvese que el Teorema 1.7 muestra que x es una combinación li- 
neal de elementos de S si y sólo si x es un elemento de L(S). Luego, por 
ejemplo, en R°, L({(1, 0, 0), (0, 1, 0)}) es el plano xy. 
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Definición. Un conjunto S de un espacio vectorial V genera a V si L(S) = V. 
En esta situación también podemos decir que los elementos de S gene- 
ran a V. 


Ejemplo 17. Los vectores (1, 1, 0), (1, O, 1), y (0, 1, 1) generan a 
R? pues un elemento arbitrario (a, a», a) de R? es una combinación lineal 
de los tres vectores dados; de hecho, los escalares r, s y t para los que 


r(1, 1, 0) + s(1,0, 1) + £(0, 1, 1) = (a, æa, as) 


son 


r= + (a, + a: — a), s = +(a, — a + a), y 1= Ha, + a, + as). 
Ejemplo 18. Los polinomios x? + 3x — 2, 2x? + 5x — 3 y —x? — 4x + 
+ 4 generan a P.(R) pues cualquiera de los tres polinomios dados perte- 


nece a P,¿(R) y cada polinomio ax? + bx + c en P,(R) es una combina- 
ción lineal de los tres; a saber, 


(—8a + 5b + 30) (x? + 3x — 2) + (4a — 2b — c)(2x? + 5x — 3) 
+ (—a +b +c)( ~x — 4x +4) = ax + bx+c. 


Ejemplo 19. Las matrices 
1 1 (o 1 1.0 
E 0) NO 1)" 11 1/7” 


o 1 
1 1) 
generan a M2.2(R) pues un elemento cualquiera 


> 


dei Aa 


Ca an) de Mo (R) 


puede ser expresado como una combinación lineal de las cuatro matrices 
dadas de la siguiente manera: 


( da, + ła T 30420 — $a) 
+ ( $a T fai — 302 T 3422) 


+ ( das, — $412 + baz, + baz) 


— O m= me O» = m 


NA Nur NS “rr 


+ (—3%411 + 3412 + da. + 34») 


_ {i Mz 
Q Gio)" 
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EJERCICIOS 
1. Decir si las siguientes expresiones son verdaderas o falsas. 

(a) El vector cero es una combinación lineal de cualquier conjunto no 
vacío de vectores. 

(b) El subespacio generado por Ø es Ø. 

(c) Si S es un subconjunto de un espacio vectorial V, L(S) es igual a 
la intersección de todos los subespacios de V que contienen a S. 

(d) Al resolver un sistema de ecuaciones lineales se puede multiplicar 
una ecuación por una constante. 

(e) Al resolver un sistema de ecuaciones lineales se permite sumar un 
múltiplo de una ecuación a otra. 

(£) Todo sistema de ecuaciones lineales tiene una solución. 


Resolver los siguientes sistemas de ecuaciones lineales por el método expues- 


to en 


(a) 


esta sección. 

2x, — 2x, — 3x, = =2 
3x, — 3x, — 2x, + 5x, = 7 
Xi — X, — 2x, — x, = —3 


3x, — 7x, + 4x, = 10 
xı — 2x, + x, = 3 
2x, — x, — 2x; = 6 
x, + 2x, — x; O 
xı + 4x, — 3x3 — 3x, = 6 
2x, + 3x, — x, + 4x, =8 


(d) (x, + 2x, + 2x, = 2 
f + 8x, + 5x, = —6 
xit xatin t tSn 3 

(e) xi + 2x, — 4x; — x+ x% = 7 

—xX; + 10x, — 3x, — 4x; = —16 

2x, + 5x, — 5x, — 4x, — x, = 2 

4x, + llx, — 7x, — 10x, — 2x, = 7 


i 
| 


xı + 2x, + 6x, = —1 


2x, + x+ x= 8 
3x + x% x3= 15 


xi + 3x, + 10x, = —5 


3. 


9.* 


10. 
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Para cada uno de los siguientes grupos de vectores en R*, determine si el 
primer vector puede o no ser expresado como una combinación lineal de 
los otros dos. 


(a) (2,0, 3), (1, 3, 0), (2, 4, — 1) 

(b) (12,3), =3,2: Dy (2, =1,=1) 
(C) A O O O E =l 

(d) LT 0), (1,2, —3), (1, —3, 2) 

(e) (5,1, —5), (1, 2,3) (—2, 3, =4) 
E (22 E thz =D; (3, e AE 


Para cada uno de los siguientes grupos de polinomios en P(R), determine 
si el primer polinomio puede o no ser expresado como una combinación 
lineal de los otros dos. 


Ga) e= 3r Sahe A e ds al NS F 3e l 

(b) 4 + 2X — 6, x? — 2x + 4x + 1, 3X2 — 6L +x+4 

(c) —2x— Le 3x + 2, x — 2x + 3x -— 1, 2x8 + x? + 3x- 2 
(d) x xt 2t LS A = 3e HAr tl aesa aa 3 

(e). x = 8e t 4x 2 IAS LA LS 

(f) di DA ZO ELA AO LA a 


En F” sea e; el vector cuya coordenada j-ésima es 1 y cuyas otras coorde- 
nadas son 0. Demostrar que (e,, €z, ... , €n} genera a F”. 


Mostrar que P,(F') puede generarse por {1, x, x?,..., ax”). 
Mostrar que las matrices 
1 0 o 1 0 0 
(o 0) (o 0): (1 0) 


generan a Mayo (F). 


0 0 
E 
Demostrar que si 


n0  /0 0 (0 1 
A (e S) y (i 


entonces el subespacio generado por (M,, Mo», My) es el conjunto de todas 
las matrices simétricas de 2 x 2. 


Para cualquier elemento x en un espacio vectorial, demostrar que L({x}) = 
= {ax: a€ F}. Interpretar este resultado geométricamente en Rè. 


Demostrar que un subconjunto W de un espacio vectorial V es un subes- 
pacio de V si y sólo si L(W) = W. 
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11.* Demostrar que si S, y $, son subconjuntos de un espacio vectorial V tales 


que $, CS», L(S,) C L(S.). En particular, si S$, CS; y L(S,) = V, se 
deduce que L(S.) = V. 


12.* Demostrar que si $, y S son subconjuntos cualesquiera de un espacio vecto- 
q y 


13. 


1.5 


rial V, entonces L(S, U $) = L(S,) + L(S.). 


Sean S, y S, subconjuntos de un espacio vectorial V. Demostrar que 
E(S, NS.) C E(S,) A L(S.). Dar un ejemplo en el cual L(S, N Se) y 
L(S,) O L(S.) sean iguales y un ejemplo donde sean distintas. 


DEPENDENCIA E INDEPENDENCIA LINEAL 


Al principio de la sección 1.4, observamos que la ecuación de un plano 
que pasa por tres puntos no colineales en el espacio, uno de los cuales 
es el origen, es de la forma x = tu + təv, donde u, v€ R? y fı y t son 
escalares. Así, un vector x en R3 es una combinación lineal de u, v € R? 
si y sólo si x se ubica en el plano que contiene a u y v. (Ver figura 1.5.) 
Vemos, por tanto, que en R* la amplitud de dos vectores no paralelos 
tiene una interpretación geométrica sencilla. Se le puede dar una interpre- 
tación similar a la amplitud de un vector individual no nulo en R?. (Ver 
el ejercicio 9 de la sección 1.4.) 


figura 1.5 


En la ecuación x = f, u + tv, x depende de u y v en el sentido de 
que x es una combinación lineal de u y v. Un conjunto en el que al 
menos un vector es una combinación lineal de los otros se llama un con- 
junto linealmente dependiente. Considérese, por ejemplo, el conjunto 
S = {X X», Xs X} G R?, donde x, = (2, —1, 4), x.= (1, —1, 3), 
x, = (1, 1, —1), y x, = (1, —2, —1). Para determinar si S es lineal- 
mente dependiente debemos ver si existe o no un vector en S que sea 
una combinación lineal de los demás. Ahora bien, el vector x, es una 
combinación lineal de x,, x» y x si y sólo si existen escalares a, b y c 
tales que 

X, = axı, + bx, + CX, 
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es decir, si y sólo si 
x= (Cla+b+c -a=b+c, 4a+ 3b-—cC). 
Por tanto x, es una combinación lineal de x,, xə y x, si y sólo si el sistema 


la+ b+c= 1 
—a— b4+c= -2 
4a + 3b—c= —1 


tiene solución. El lector deberá verificar que en este caso no existe tal 
solución. Nótese, sin embargo, que esto no significa que el conjunto S 
no sea linealmente dependiente, pues es necesario verificar si xı, X2 y Xs 
pueden o no ser escritos como una combinación de los otros vectores 
de S. Puede demostrarse, de hecho, que x, es una combinación lineal de 
Xi, X2 Y X,; específicamente, x, = 2x, — 3x2 + Ox,. Así, S es en efecto 
linealmente dependiente. 

Se ve de este ejemplo que la condición para dependencia lineal que 
se ha dado no es adecuada, porque no todo vector en S necesita ser una 
combinación lineal de los demás, aun cuando S sea linealmente depen- 
diente. Reformulando la definición de la siguiente manera obtenemos una 
definición de dependencia más fácil de usar. 


Definición. Un subconjunto S de un espacio vectorial V es linealmente depen- 


diente si existe un número finito de vectores distintos X,, Xə», ... , X en S 
y escalares a, az, ..., a, en F, no todos cero, tales que aX, + aX: + 
+... + anXn = 0. También se puede describir esta situación diciendo 


que los elementos de S son linealmente dependientes. 


Para demostrar que el subconjunto S de R: que hemos definido es 
linealmente dependiente usando esta definición, debemos encontrar esca- 
lares a,, a», a3 y as, no todos nulos, tales que 


aX; + AXo + A3X3 + AXi = 0 


> 


es decir, tales que 


(2a + d» + E) + Ca, — Ay — d» + ds A 24,, 4a, + 3a; mS A3 +3 as) == 
= (0, 0, 0). 


Por ello debemos encontrar una solución para el sistema 


2a, + a, +a, + a=0 
—4a, — 4, + a; — 2a, = 0 
4a, + 3a, — a; — a, =0 
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donde no todas las incógnitas valen cero. Como para el caso propuesto 
antes sabemos que x, = 2x, — 3x. + Ox,, se tiene que 0 = 2x, — 3x: — 
— x; + Ox,. De aquí, tenemos que a, = 2, a, = —3, a= -—1 ya, =0 
es dicha solución. 

Por lo tanto se ve que la definición establecida de dependencia lineal 
requiere de la solución de únicamente un sistema de ecuaciones en vez 
de dos o más. El lector deberá verificar que las dos condiciones para 
dependencia lineal que hemos tratado son, de hecho, equivalentes. (Ver 
ejercicio 10.) 

Puede verse fácilmente que, en cualquier espacio vectorial, un subcon- 
junto S que contenga al vector cero debe ser linealmente dependiente. 
Como 1:0= 0, el vector cero es una combinación lineal de elementos 
de S en la que algún coeficiente es no nulo. 


Ejemplo 20. En Rt el conjunto S= ((1, 3, —4, 2), (2, 2, —4, 0), 
(1, —3, 2, —4)} es linealmente dependiente puesto que 


4(1, 3, —4, 2) — 3(2, 2, —4, 0) + 2(1, —3, 2, —4) = (0, 0, 0, 0). 


De manera semejante, en Maxa(R) el conjunto 


¡A A a 


es linealmente dependiente puesto que 


1 —3 2 -3 7 4 -2 3 11 
5(_4 0 s) +3{ 6 -2 aA -3 > 


Definición. Se dice que un subconjunto S de un espacio vectorial, que no es 
linealmente dependiente, es linealmente independiente. Como anteriormen- 
te, describiremos a menudo esta situación diciendo que los elementos de 
S son linealmente independientes. 


Nótese que el conjunto vacío es linealmente independiente, puesto que 
obviamente los conjuntos linealmente dependientes deben ser no vacíos. 
Más aún, en cualquier espacio vectorial, un conjunto integrado de un 
solo vector no nulo es linealmente independiente. Si {x} es linealmente 
dependiente, entonces ax = 0 para algún escalar a no nulo. Pero en- 
tonces 


x=a (ax) = a 0=0. 


Además, un conjunto S es linealmente independiente si y sólo si las 
únicas combinaciones lineales de elementos de S iguales a O son las com- 


Dependencia e independencia lineal 39 


binaciones lineales triviales en donde todos los escalares valen cero. Este 
hecho proporciona un método muy útil para determinar si un conjunto 
finito es linealmente independiente. Esta técnica se ilustra en el siguiente 
ejemplo. 


Ejemplo 21. Sea x, el vector en F° cuyas primeras k — 1 coordenadas 
son ceros y cuyas últimas n— k + 1 coordenadas son 1. Entonces 


{Xi Xo... Xn} es linealmente independiente, porque si axı + aX + 
+ ... + anXn = 0, igualando las coordenadas correspondientes de la iz- 
quierda y derecha de esta igualdad se tiene el siguiente sistema de ecua- 
ciones: 

a; =0 

a, +4, =0 


a, +4, +a, =0 


4, +a, +a, +- +a, =0. 


Claramente se ve que la única solución de este sistema es 4, = @ = ... = 
= An = 0. 


Los siguientes resultados útiles son consecuencias inmediatas de las 
definiciones de dependencia e independencia lineal. 


Teorema 1.8. Sea V un espacio vectorial y sea S, C S, C V. Si S, es lineal- 
mente dependiente entonces S, también lo es. 
DEMOSTRACIÓN. Ejercicio. 

Corolario. Sea V un espacio vectorial y sea S, C S, C V. Si S; es linealmente 
independiente entonces S, también lo es. 


DEMOSTRACIÓN. Ejercicio. 


EJERCICIOS 
1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Si S es un conjunto linealmente dependiente, cada elemento de S 
es una combinación lineal de otros elementos de S. 


(b) Cualquier conjunto que contenga al vector cero es linealmente de- 
pendiente. 


(c) El conjunto vacío es linealmente dependiente. 
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(d) Subconjuntos de conjuntos linealmente dependientes son linealmente 
dependientes. 

(e) Subconjuntos de conjuntos linealmente independientes son lineal- 
mente independientes. 

(£) Si xi, Xx»..., Xa son linealmente independientes y axı + asx, + 
+... + anXn = 0, todos los escalares a; son iguales a cero. 


En F sea e; el vector cuya coordenada j-ésima es 1 y las demás son 0. 


Demostrar que (e,, ez, ..., en) es linealmente independiente. 
Demostrar que el conjunto (1, x, x?, ... , x”) es linealmente independiente 
en Pa(F). 


Demostrar que las matrices 


(o 0) (o o) (i 0) 


son linealmente independientes en M»,2(F). 


(o 1) 


Encontrar el conjunto de matrices diagonales linealmente independientes 
que generan al espacio vectorial de matrices diagonales de 2 x 2. 


Demostrar que (x, y) es linealmente dependiente si y sólo si x o y es un 
múltiplo del otro. 


Dar un ejemplo de tres vectores linealmente dependientes en R? tales que 
ninguno de los tres es múltiplo de otro. 


Demostrar el Teorema 1.8 y su corolario. 

(a) Demostrar que (u, v) es linealmente independiente si y sólo si 
{u + v, u — v} es linealmente independiente. 

(b) Demostrar que (u, v, w) es linealmente independiente si y sólo si 


{u + v, u + w, v + w} es linealmente independiente. 


Demostrar que un conjunto S es linealmente dependiente si y sólo si $ = {0} 


o si existen vectores distintos y, Xı, Xə ..., xn en S tal que y es una 
combinación lineal de x,, Xx», ... , Xn. 

Sea S = [X,, X2, ... , Xn} un conjunto finito de vectores. Demostrar que 
S es linealmente dependiente si y sólo si x,=0, O Xy. € LA Aa oa 


Xxx)) para alguna k < n. 


Demostrar que un conjunto $ de vectores es linealmente independiente si 
y sólo si cada subconjunto finito de S es linealmente independiente. 


13. 


14. 


1.6 
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Sea M una matriz cuadrada triangular superior (como se definió en el 
ejercicio 12 de la sección 1.3) que tenga términos no nulos en la diagonal. 


Demostrar que las columnas de M son linealmente independientes. 


Sean f y g funciones definidas por f(t) = e! y g(t) = e**, donde rs. 
Demostrar que f y g son linealmente independientes en F(R, R). Sugeren- 
cia: Suponer que ae”! + be*t = 0. Hacer 1= 0 y obtener una ecuación 


que involucre a y b. Luego diferenciar ae”t + be*t = 0, y hacer t= 0 


para tener una segunda ecuación en a y b. Resolver ambas ecuaciones para 


a y b. 


BASES Y DIMENSION 


Un subconjunto S de un espacio vectorial V que sea linealmente indepen- 
diente y que genere a V posee una propiedad muy útil —cada elemento 
de V puede ser expresado de una y sólo una manera como combinación 
lineal de elementos de S. (Esta propiedad será demostrada en el Teore- 
ma 1.9.) Es este resultado el que hace que los conjuntos generadores 
linealmente independientes sean los elementos constructivos de los espa- 
cios vectoriales. 


Definición. Una base 8 para un espacio vectorial V es un subconjunto lineal- 


mente independiente de V que genera a V. (Si B es una base de V, dire- 
mos a menudo que los elementos de B forman una base de V.) 


Ejemplo 22. Recordando que L(Ø@) = {0}, se dice que Ø es una base 
para el espacio vectorial (0). 


Ejemplo 23. En F”, sea e, = (1,0,0,...,0,0), e. = (0, 1,0,..., 
0,0), ... , €n = (0, 0, 0,..., 0, 1); se ve claramente que {e;, €», ..., 
e,) es una base para F" y se llama base estándar para F". 


Ejemplo 24. En Muxn(F), sea M'! la matriz cuyo único elemento no 
nulo es un 1 en el ¿ésimo renglón y j-ésima columna. Luego (M'?: 
1<i<m,1<j<n) es una base para Mmxn(F). 


Ejemplo 25. En P,(F) el conjunto (1, x, x°, ... , x”) es una base. 

Ejemplo 26. En P(F) el conjunto (1, x, x?, ...) es una base. 
Observar que el ejemplo 26 muestra que una base no necesariamente 

debe ser finita. De hecho, veremos más adelante en esta sección que nin- 


guna base para P(F) puede ser finita. Entonces, no todo espacio vectorial 
tiene una base finita. 


42 


Espacios vectoriales 


El siguiente teorema, que se utilizará frecuentemente en el capítulo 2, 
muestra la propiedad más importante de una base. 


Teorema 1.9, Sea V un espacio vectorial y B = [X,, ... , Xa} un subconjunto 


Lema. 


de V. Luego B es una base de V si y sólo si cada vector y en V puede 
ser expresado de manera única como una combinación lineal de vectores 
de ß, es decir, puede ser expresado en la forma 


y= aX, +... + anXn 
para escalares únicos a, ... , an. 


DEMOSTRACIÓN. Sea 8 una base para V. Si y€ V, entonces y€ L(8) 
puesto que L(8) = V. Luego, y es una combinación lineal de los elemen- 
tos de 8. Supóngase que y = axı + ... + anXn y y = bix, +... + bnăXn 
son dos posibles representaciones de y. Restando la segunda igualdad de 
la primera se tendrá 


0 = (a, — bx, + ... + (an — ba) Xn. 


Como £ es linealmente independiente, se tiene que a, — b, = ... = an — 
— b, = 0. Luego, a, = b,,... , an = ba, de tal modo que y sólo puede 
expresarse como una única combinación lineal de los elementos de £. 

La prueba de la proposición recíproca se deja al lector como ejer- 
cicio. W l 


El Teorema 1.9 muestra que cada vector v en un espacio vectorial V 
con una base 8 = {xı, ... , xn) puede ser expresado de manera única en 
la forma v = ax, + ... + anXn para escalares a,, ... , a, seleccionados 
adecuadamente. Luego, v determina una única n-dimensional de escalares 
(41, ..., An) y, recíprocamente, cada n-dimensional de escalares deter- 
mina un vector único v, al utilizar los términos de la n-dimensional como 
los coeficientes de una combinación lineal de los vectores de 8. Este he- 
cho sugiere que V es similar al espacio vectorial F", donde n es el 
número de vectores de una base para V. En la sección 2.4 veremos que 
éste es realmente el caso. 

Nuestro próximo teorema identificará una gran clase de espacios vec- 
toriales, cada uno de ellos con una base finita. Sin embargo, es necesario 
que primero probemos un resultado preliminar. 


Sea S un subconjunto linealmente independiente de un espacio vectorial 
V, y sea x un elemento de V que no está en S. Luego, S U {x} es lineal- 
mente dependiente si y sólo si x€ L(S). 


DEMOSTRACIÓN. Si S U {x} es linealmente dependiente, deberán existir 
vectores Xi, ... , Xn en S U {x} y escalares no nulos a,, ... , a, tales que 
AX t ... t anXn = 0. Puesto que S es linealmente independiente, una 
de las x;, digamos x, es igual a x. Por ello ax + asx; + ... + anXn = 0, 
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y así x= a (aX: — ... — AnXn). Como x es una combinación lineal 
de xj, ... , Xa que son elementos de S, x€ L(S). 

Recíprocamente, supóngase que x€ L(S). Luego, existen vectores 
Xi... , Xn en § y escalares i, ..., an tales que x = axı + ... F anXn. 
Así, 0 = axı + ... + anXn + (—1)x, y como x Æ x; para i = 1,..., N, 
{Xi -.. , Xm x} es linealmente dependiente. Por tanto, S U {x} es lineal- 


mente dependiente por el Teorema 1.8. W 


Teorema 1.10. Si un espacio vectorial V es generado por un conjunto finito 
So, entonces un subconjunto de S, es una base para V. Y por tanto, V 
tiene una base finita. 


DEMOSTRACIÓN. Si Se= Ø o Sə = {0}, entonces V = {0} y Ø es un 
subconjunto de S, que es una base para V. De lo contrario, So contendrá 
un elemento x, no nulo. Nótese que (x,) es un conjunto linealmente 


independiente. Continúese, si es posible, escogiendo elementos Xə, ... , Xr 
en S, tales que (X,, Xz, ... , Xr} sea linealmente independiente. Como So 
es un conjunto finito, se debe alcanzar una etapa en la que $ = O A 


sea un subconjunto linealmente independiente de Se pero que al añadir 
a S cualquier elemento de So que no esté en S se produzca un conjunto 
linealmente dependiente. Demostraremos entonces que $ es una base para 
V. Como S es linealmente independiente, basta con demostrar que 
L(S) = V, pero como L(S,) = V, de acuerdo con el Teorema 1.7 es 
suficiente demostrar que So C L(S). Sea x€ So. Si x€ S, entonces evi- 
dentemente x€ L(S). De otra forma, si x ÉS, la anterior construcción 
mostraría que S U {x} es linealmente dependiente. Así, x € L(S) de acuer- 
do con el lema y, por tanto, So C L(S). E 


El método por el cual se obtuvo la base $ en la demostración anterior 
es una manera útil de obtener bases. Un ejemplo de este procedimiento es 
el que se da a continuación. 


Ejemplo 27. Los elementos (2, —3, 5), (8, —12, 20), (1, 0, —2), 
(0, 2, —1) y (7, 2, 0) generan a R°. De entre ellos seleccionaremos una 
base para Rë. Para empezar, selecciónese cualquier elemento no nulo del 
conjunto generatriz, digamos (2, —3, 5), como uno de los elementos de 
la base. Como 4(2, —3, 5) = (8, —12, 20), el conjunto ((2, —3, 5), 
(8, —12, 20)) es linealmente dependiente (ejercicio 6, sección 1.5). Por 
tanto, (8, —12, 20) no será incluido en nuestra base. Como (1, 0, —2) 
no es múltiplo de (2, —3, 5), y viceversa, el conjunto ((2, —3, 5) (1, 0, 
—2)) es linealmente independiente. Por tanto, (1, 0, —2) puede ser 
incluido en la base. Procediendo con el siguiente elemento del conjunto 
generatriz, se deberá excluir o incluir en nuestra base al elemento (0, 2, 
—1) dependiendo de que el conjunt {(2, —3, 5), (1,0, 2), (0, 2, 
—1)} sea linealmente dependiente o linealmente independiente. Un cálcu- 
lo sencillo demuestra que el conjunto es linealmente independiente; luego, 
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(0, 2, —1) también será incluido en nuestra base. El elemento final del 
conjunto generatriz (7, 2, 0) será excluido o incluido en nuestra base 
dependiendo de que ((2, —3, 5), (1, 0, —2), (0, 2, —1), (7, 2, 0)) 
sea linealmente dependiente o linealmente independiente. Ya que 


2(2, —3, 5) + 3(1, 0, 0, —2) + 4(0, 2, —1) — (7, 2, 0) = (0, 0, 0), 


el conjunto es linealmente dependiente y se excluye a (7, 2, 0) de la base. 
De esta manera, el conjunto {(2, —3, 5), (1, 0, —2), (0, 2, —1)) es 
una base para R?. 


El siguiente teorema y sus corolarios son quizá los resultados más 
significativos del capítulo 1. 


Teorema 1.11. Sea V un espacio vectorial que tiene una base fB con exacta- 


mente n elementos. Sea S = [yx, ... , ym) un subconjunto linealmente 
independiente de V que contenga exactamente m elementos, donde m < n. 
Entonces, existe un subconjunto S, de B que contiene exactamente n — m 
élementos tales que S U S, genera a V. 


DEMOSTRACIÓN. La demostración se hará por inducción sobre m. Prin- 
cipiaremos la inducción con m = 0, pues en este caso S$ = Ø, y así Sı = 8 
satisface claramente la conclusión del teorema. 

Ahora, supóngase que el teorema es cierto para alguna m tal que 
m < n. Demostraremos que el teorema es cierto para m + 1. Sea S = (y,, 

<., Ym, Jm) un subconjunto de V linealmente independiente, el cual 
contiene exactamente m + 1 elementos. Como (y,, ... , Ym} es linealmen- 
te independiente, de acuerdo con el corolario al Teorema {.8, aplicamos 
la hipótesis de inducción para concluir que existe un subconjunto (X,, ..., 
Xnm) de 8 tal que {Yı ... , Ym} U {Xı, --. , Xn-m} genera a V. Por lo 
tanto, existirán escalares 4;, ... , Gm, Di, bo, ... , Bn-m tales que 


Ym+1 = ıyı + ... + UmYm + b,x, + box» + e.. + Dna-mXn=m» (11) 


Obsérvese que algún b;, tal como b,, es no nulo, pues de lo contrario la 
ecuación (11) implicaría que ym,. es una combinación lineal de y,, ..., 
Ym en contradicción con la suposición de que (y,, ... , Ym, Jm.) es lineal- 
mente independiente. Resolviendo la ecuación (11) para x, se tendrá 


X = (Tb a)yy +... + (04m) Ym — (DP) Yma + (A D7b2)xo 


E... + (bam) Xnm> (12) 
Entonces x, EL([Ys, ... , Yms Yms X25 «>> > Xn-m} de acuerdo con la ecua- 
ción (12), pero como Yı, ... , Ym, X2, --. , Xnm SON Claramente elementos 
de L((y,, aoro Ym Ym Xos >., Xnm)), se tendrá que 


{Yis --- > Ym, Xis Xos «> Xnmj C L({Yi -.- , Yms Yma X2, + ++ > Xnm})- 
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Por tanto, el Teorema 1.7 implica que 


L(O,, 1.. Yms Yms X2y ... , Xn-m) ) = V. 


Luego, el escoger S, = (x», ... , Xnm) demuestra que el teorema es cierto 
para m + 1. 
Esto completa la demostración. 


Para ilustrar el Teorema 1.11, nótese que $ = (1? — 4, x — 6) es un 
subconjunto linealmente independiente de P.(F). Como B=(L x, x} 
es una base de P.(F), deberá de existir un subconjunto S, de 8 que con- 
tenga 3 — 2 = 1 elemento tal que S U S, genere a P.(F). En este ejemplo 
cualquier subconjunto de 8 que contenga un elemento será suficiente para 
Sı. Con esto se ve que el conjunto S, del Teorema 1.11 no necesariamente 
es único. 


Corolario 1. Sea V un espacio vectorial que tiene una base 8 que contenga exacta- 
mente n elementos. Entonces, cualquier subconjunto linealmente indepen- 
diente de V que contenga exactamente n elementos es una base de V. 


DEMOSTRACIÓN. Sea S = (y,,..., yn) un subconjunto de V lineal- 
mente independiente que contiene exactamente n elementos. Aplicando el 
Teorema 1.11 se ve que, existe un subconjunto S, de 8 que contiene 
n — n = Q elementos tal que SU S, genera a V. Obviamente S, = Ø; 
luego, S genera a V. Como S es también linealmente independiente, S es 
una base para V. E 


Ejemplo 28. Los vectores (1, —3, 2), (4, 1, 0) y (0 2, —1) forman 
una base para R?, ya que si 
a(l, —3, 2) + az(4, 1,0) + ax(0, 2, —1) = (0, 0, 0), 


entonces a,, a, y az deberán satisfacer el sistema de ecuaciones 


f a, + 4a, =0 
—3a, + a, + 2a, = 0 
2a, — a, =Q. 


Pero puede verse fácilmente que la única solución del sistema es a, = O, 
a =0 y az = 0. Entonces, (1, —3, 2), (4, 1, 0) y (0, 2, —1) son 
linealmente independientes y, de acuerdo con el corolario 1, forman una 
base para R°. 


Corolario 2. Sea V un espacio vectorial que tiene una base B con exactamente 
n elementos. Entonces, cualquier subconjunto de V que contenga más 
de n elementos es linealmente dependiente. Consecuentemente, cualquier 
subconjúnto de V linealmente independiente contiene como máximo n 
elementos. 
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DEMOSTRACIÓN. Sea S un subconjunto de V que contiene más de n ele- 
mentos. Con el fin de llegar a una contradicción supondremos que $ es 
linealmente independiente. Sea S, un subconjunto cualquiera de S con 
exactamente n elementos. Entonces, de acuerdo con el corolario anterior, 
S, es una base de V. Como S, es un subconjunto propio de S, podemos 
tomar un elemento x de S que no sea elemento de S,. Como S, es una 
base de V, x€ L(S,) = V. Luego, el lema previo al Teorema 1.10 impli- 
ca que S, U {x} es linealmente dependiente. Pero S, U {x} C S; luego, 
S es linealmente dependiente —una contradicción. Se concluye, por tanto, 
que S es linealmente dependiente. MW 


Ejemplo 29. Sea S = {x? +7, 8x? — 2x, 4x — 3, 7x + 2). Aun cuando 
se pueda demostrar directamente que S es un subconjunto linealmente 
dependiente de P.(F), esta conclusión se deriva inmediatamente del coro- 
lario anterior puesto que 8 = (1, x, x°} es una base para P.(F) que 
contiene menos elementos que S. 


Corolario 3. Sea V un espacio vectorial que tiene una base B con exactamente 


n elementos. Entonces, toda base para V contendrá exactamente n ele- 
mentos. 


DEMOSTRACIÓN. Sea S una base de V. Como S es linealmente indepen- 
diente tendrá como máximo, de acuerdo con el corolario 2, n elementos. 
Supóngase que S contiene exactamente m elementos; luego, m < n. Pero, 
además, S es una base de V y 8 es un subconjunto linealmente indepen- 
diente de V. Entonces, el corolario 2 puede ser aplicado intercambiando 
los papeles de 8 y S para dar n < m. Luego m= nm. M 


Si un espacio vectorial tiene una base con un número finito de elemen- 
tos, entonces el corolario anterior establece que el número de elementos 
en cada base para el espacio es el mismo. Este resultado hace posibles 
las siguientes definiciones. 


Definiciones. Un espacio vectorial V se llama dimensionalmente finito si tiene 


una base que consta de un número finito de elementos; el único número 
de elementos en cada base de V se llama dimensión de V y se denota por 
dim(V). Si un espacio vectorial no es dimensionalmente finito, se llama 
dimensionalmente infinito. 


Los siguientes resultados son consecuencia de los ejemplos 22 a 26. 
Ejemplo 30. El espacio vectorial {0} tiene dimensión cero. 


Ejemplo 31. El espacio vectorial F” tiene dimensión n. 
Ejemplo 32. El espacio vectorial Mmx»(F) tiene dimensión mn. 
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Ejemplo 33. El espacio vectorial P.,(F) tiene una dimensión n + 1. 
Ejemplo 34. El espacio vectorial P(F) es dimensionalmente infinito. 


Los dos ejemplos siguientes demuestran que la dimensión de un espa- 
cio vectorial depende de su campo de escalares. 


Ejemplo 35. El espacio vectorial de los números complejos tiene dimen- 
sión 1 sobre el campo de los números complejos. (Una base es (1).) 


Ejemplo 36. El espacio vectorial de los números complejos tiene dimen- 
sión 2 sobre el campo de los números reales. (Una base es (1, ¿).) 


Corolario 4. Sea V un espacio vectorial de dimensión n, y sea S un subcon- 
junto de V que genera a V y contiene como máximo n elementos. Entonces, 
S es una base para V y, por tanto, contiene exactamente n elementos. 


DEMOSTRACIÓN. Existe un subconjunto S, de S tal que S, es una base 
de V (Teorema 1.10). Por el corolario 3, S, contiene exactamente n ele- 
mentos. Pero $, C $ y $ contiene a lo más n elementos, luego S = S, y 
S es una base de V. E 


Ejemplo 37. Se tiene del ejemplo 18 y del corolario 4 que {x? + 3x — 2, 
2x? + 5x — 3, —x? — 4x + 4) es una base para P.(R). 


Ejemplo 38. Se tiene del ejemplo 19 y del corolario 4 que 
1 1 1 1 1 0 o 1 
(i 0) 0 1), (i 1 1 i 


TS 
Corolario 5. Sea B una base de un espacio vectorial V de dimensión n y sea 
S un subconjunto linealmente independiente de V que contiene m elemen- 
tos. Entonces, existe un subconjunto S, de B tal que S O S, es una base 
de V. 


forma una base de M.,.»(R). 


DEMOSTRACIÓN. Por el corolario 2 del Teorema 1.11 sabemos que 
m < n. Entonces, por el Teorema 1.11, existe un subconjunto S, de 8 
que contiene exactamente n — m elementos tal que S U S, genera a V. 
Es obvio que S U S$, contiene a lo más n elementos; así, el corolario 4 
implica que S U S, es una base de V. E 


Los Teoremas 1.10 y 1.11, sus cinco corolarios y el ejercicio 11 con- 
tienen foda una riqueza de iaforhacicn acerca de las relaciones entre 
conjuntos linealmente independientes, bases y conjuntos generatrices. Por 
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esta razón resumiremos los principales resultados de esta sección para 
situarlos en una mejor perspectiva. 

Una base de un espacio vectorial V es un subconjunto linealmente 
independiente de V que genera a V. Si V tiene una base finita, entonces 
cualquier base de V contiene el mismo número de vectores. Este número 
se llama dimensión de V, y se dice que V es dimensionalmente finito. 
Luego, si la dimensión de V es n, toda base para V contiene exactamente 
n vectores. Además, cada subconjunto de V linealmente independiente 
contiene no más de n vectores y puede ser tomado como base de V me- 
diante la inclusión de vectores adecuadamente escogidos. Por otra parte, 
cada conjunto generatriz de V contiene al menos n vectores y puede ser 
transformado en una base para V eliminando adecuadamente algunos de 
los vectores escogidos. La figura 6 describe estas relaciones. Veremos en 
la sección 2.4 que todo espacio vectorial sobre F de dimensión n es esen- 
cialmente el espacio F», 


«conjunto que genera a 
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Una base de V 


Un 
subconjunto de V 
linealmente 
independiente 


figura 1.6 


El siguiente ejemplo ilustra cómo pueden utilizarse estos resultados 
para obtener una importante conclusión no trivial. 


Sean Co, Ci, ... , Cn elementos distintos de un campo infinito F. Los 
polinomios fo(x), f(x), ... , fn(x), donde 
mae (x = Co)... (X = Ci) (X — Cin)... (X — Ca) 
(Ci = Co)... (Ci — Cia) (Ci — Cin)... (Ci — Cn) 
n xC 
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se llaman polinomios de Lagrange (asociados a Co, Cı, ... , Cn). Tomando 
a f(x) como una función polinomial f;: F — F, se ve que 
fo s1si4j 
E a, (13) 


Se utilizará esta propiedad de los polinomios de Lagrange para demos- 
trar que 8 = (fo, f, ... , fn} es un subconjunto linealmente independiente 
de P,(F). Como la dimensión de P,(F) es n + 1 se tendrá por el coro- 
lario 1 del Teorema 1.11 que 8 es una base de P, (F). Para demostrar 
que £ es linealmente independiente, supóngase que: 


n 
N af, = 0 para algunos escalares as, ai, ... , On. 
4=0 


donde 0 es la función cero. Entonces 
2aifi(ci)=0  paraj=0,1,...,nm. 
i=0 
pero también 
> aifilc;) = a; 
i=0 
por la ecuación (13). De aquí que a; = 0 para j= 0, 1,..., n y se 
tiene que 8 es linealmente independiente. 


Como £ es una base para P,(F), toda función polinomial g en P,(F) 
es una combinación lineal de elementos de £, esto es 


g= Y bí.. 
í=0 
Entonces 
ec) = Y bif.(c;) = b;; 
i=0 
así 


2875 Sgleo): 


es la representación única de g como combinación lineal de elementos de 
B. Esta representación se llama ecuación de interpolación de Lagrange. 
Véase que el argumento anterior muestra que si bo, b,, ... , ban son cua- 
lesquiera n + 1 elementos de F (no necesariamente distintos), entonces 
la función polinomial 


E 2 dif: 


es el único elemento de P,(F) tal que g(c;) = b;. Luego entonces, hemos 
encontrado el único polinomio cuyo grado no excede a n que tiene valores 
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específicos b; en puntos dados c; en su dominio (j = 0, 1,... , n). Por 
ejemplo, construyamos el polinomio real g de grado máximo 2 cuya 
gráfica contiene a los puntos (1, 8), (2, 5) y (3, —4). (Luego, con la 
notación anterior, Co = 1, c,=2,C.-=3,b,=8, b,=5, y b= -4.) 
Los polinomios de Lagrange asociados a co, Cı, y c. son 


CADA) 1 
fix) = NESNE = ¿4 5x + 6), 
o e OE: A boe 
O TON 1(x 4x + 3), 
y 
a O a e: 


G-DG=2 2 
De aquí, el polinomio deseado es 


200) = X bifil) = Bf) + Sha) — 4fa(x) 


4 = 32 0) 3 ds) al AA Z) 
= — 3x" + 6x + 5. 


Una consecuencia importante de la ecuación de interpolación de La- 
grange es el siguiente resultado: Si f € P,(F) y f(c;) = O para n + 1 ele- 
mentos diferentes Cə, Ci, ... , Cn en F, f será la función cero. 

El siguiente resultado relaciona la dimensión de un subespacio con la 
dimensión del espacio vectorial que la contiene. 


Teorema 1.12. Sea W un subespacio de un espacio vectorial V de dimensión 


n. Entonces, W es dimensionalmente-finito y dim(W) < n. Además, si 
dim(W) = n, entonces W = V. 


DEMOSTRACIÓN. Si W = {0}, entonces W es dimensionalmente finito y 
dim(W) = O < n. De otra manera, existe un elemento no nulo x, en W, 
y así (x,) es un conjunto linealmente independiente. Continuando en esta 
forma, tómense elementos x,,... , x, en W tales que (x,, ... , Xx} sea 
linealmente independiente. Este proceso debe terminar en una etapa donde 
{Xn ..., xx) sea linealmente independiente pero de manera que al aña- 
dir cualquier elemento de W se tenga un conjunto linealmente dependien- 
te (puesto que ningún subconjunto linealmente independiente de V puede 
contener más de n elementos). Entonces, W tiene una base finita que 
contiene no más de n elementos; esto es, dim(W) < n. 

Si dim(W) = n, entonces una base para W sería un subconjunto de 
V linealmente independiente que contuviera n elementos. Pero el corola- 
rio 1 del Teorema 1.11 implica que la base para W es también una base 
para V y se tiene que W = V. E 
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Corolario. Si W es un subespacio de un espacio V dimensionalmente finito, 
entonces W tiene una base finita y cualquier base para W es un: subcon- 
junto de una base para V. 


DEMOSTRACIÓN. El teorema muestra que W tiene una base finita S. Si 8 
es alguna base para V, entonces existe un subconjunto S, de 8 tal que 
S U S, es una base para V (Teorema 1.11). De aquí que S es un subcon- 
junto de una base para V. E 


Podemos utilizar el Teorema 1.12 para analizar geométricamente los 
subespacios de R? y R?. 

Como R? tiene dimensión 2 sobre R, los subespacios de R? pueden ser 
solamente de dimensiones 0, 1 ó 2. Los únicos subespacios de dimensiones 
O ó 2 son {0} y R?, respectivamente. Cualquier subespacio de R? que 
tenga dimensión 1 consta de todos los múltiplos escalares de algún vector 
no nulo en R? (ejercicio 9 de la sección 1.4). 

Si algún punto de R? se identifica de manera natural con un punto del 
plano Euclidiano, entonces es posible describir los subespacios de R? geo- 
métricamente: Un subespacio de R? de dimensión O consta del origen del 
plano Euclidiano, un subespacio de R? de dimensión 1 consta de una 
recta que pasa por el origen y un subespacio de R? que tengan dimensión 
2 es todo el plano Euclidiano. 

Similarmente, los subespacios de R? deben tener dimensión 0, 1, 2 ó 
3. Interpretando estas posibilidades geométricamente, vemos que un sub- 
espacio de dimensión cero debe ser el origen del sistema coordenado 
Euclidiano en el espacio, un subespacio de dimensión 1 es una recta que 
pasa por el origen, un subespacio de dimensión 2 es un plano que pasa 
por el origen y un subespacio de dimensión 3 es el mismo espacio Eucli- 
diano de 3 dimensiones. 


Ejemplo 39. Sea W = ((a,,..., a) € F: a, + as + as = 0, a. = as). 
Entonces W es un subespacio de F* con ((1, 0, 0, 0, —1), (0, 0, 1, 0, —1), 
(0, 1, 0, 1, 0)) como una base. Por tanto, la dimensión de W es 3. 


Ejemplo 40. El conjunto de las matrices diagonales de n x n forma un 
subespacio W de M,:.(F). (Ver ejemplo 8.) Una base para W es 
(M3, M2, ..., M””) donde Mi! es la matriz definida en el ejemplo 24. 
Así, la dimensión de W es n. 


Ejemplo 41. Vimos en la sección 1.3 que el conjunto de las matrices 
simétricas de n x n forma un subespacio W de M,,n(F). Una base para 
W es [4'%: 1<i<j<mn), donde A'! es la matriz de nx n que 
tiene 1 en el ¡-ésimo renglón y la j-ésima columna, 1 en el j-ésimo renglón 
y ¡-ésima columna, y O en los demás términos. Por tanto, la dimensión de 
Wes nt (n= 1)+... + 1= łn(n +1). 
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Ejemplo 42. El conjunto de polinomios de la forma a,sx!? + aex? + 
+... + ax? + a donde a, 45, ..., dis, ais € F, componen un subes- 
pacio W de P,s.(F) de dimensión 10 puesto que {1, x?, x*,..., X8} es 
una base para W. 


Si W, y W3 son subespacios de un espacio vectorial V, vimos en la 
sección '1.3 que también lo son W, N W3 y W, + Wa. Es natural preguntar 
si las dimensiones de estos subespacios pueden calcularse directamente a 
partir de las dimensiones de W, y Wz. Desafortunadamente esto no es posi- 
ble. Existe, sin embargo, una relación entre dim(W, + We), dim(W,), 
y dim(W;). 


Teorema 1.13. Sean W, y W: subespacios dimensionalmente finitos de un es- 
pacio vectorial V. Entonces, W, + W. es dimensionalmente finito y 


dim(W, + W,) = dim(W,) + dim(W;) — dim(W, N Wa). 


DEMOSTRACIÓN. Como W, N W: es un subespacio de un espacio dimen- 
sionalmente finito W,, W, N W, tiene una base finita Bo = [X1, ... , Xx) 
(Teorema 1.12). Usemos el corolario del Teorema 1.12 para encontrar 
Bı = (Vs...) Yr} y Be = {Zu ... , Zm} tales que Bo U $6, sea una base 
para W: y Bo U 8z sea una base para W.. Demostraremos que o U 8, U 
U B3 = [Xx > Xx Yao ++. >) Yr Za) ++» >» Zm} es una base para W, + Wo. 
Se seguirá que W, + We es dimensionalmente finita y que 


dim(W, + W.) =k+r+m=(k+r)+ (k+m)-— k 


Para demostrar que 8, U 8, U f; es una base para W, + W., demos- 
traremos primero que fo U Bı U £z es linealmente independiente. Supón- 
gase que 


MATE AR + biyi EDITE CA +... H Cmm O 
para algunos escalares a,, ... , Ag, bi, ... , Dr, Ci, -.- , Cm. Sea 


Vo = GX: +... F GX, v = biyi +... + byr 


VE Cita F Ohma 
NE 


obsérvese que vo € W, N Wa, v, € W,,y v: € W. La igualdad anterior pue- 
de expresarse como Vvo + v, + v:'= 0; así, Vo + v, = —v:. En esta última 
igualdad el miembro izquierdo es un elemento de W, y el miembro derecho 
es un elemento de W,. Entonces —v, es tanto un elemento de W, como 
de W., esto es, —v: € Wa N W,. Como (X,, ..., xx) es una base para 

/ W, N W,, existen escalares d,,... , dx tales que ~v: = dixi +... + 
+ dyX;. Ahora bien, 
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0O= Y. EV +v 
= (axı +... + ax) + (biyi +... + b,y,) 
+ (—dixı — ... — A) 
(a — di)xı + ... + (as AX + biyi +... + b,yr 


Il 


Así tenemos una combinación lineal de elementos de 8o U 8, que es igual 
al vector cero; pero So U f, es un conjunto linealmente independiente, y 


así a — dı = ... = ak — dy = b, =... =b, = 0. De aquí que v, = 0. 
Entonces 
0 = vo + vi + v 5 Vo t V = AX H a.o.. F aX tC t an. F Cmm 


de manera que una combinación lineal de elementos de $, U 8, es igual 
al vector cero. Como antes, el hecho de que 6, U 8, sea un conjunto lineal- 
mente independiente implica que a, = ... = ak = C1 =... =Cm=0. 
Como a, = ... = @y = b, = ... = b, =c = ... = Cm™= 0, hemos de- 
mostrado que 8o U Bı U £z es linealmente independiente. 

Falta demostrar que 8, U f, U Bz genera a W, + Wo. Pero ahora te- 
nemos que L(fBo U 81) = W, y L(fo U B2) = W: puesto que Bo U f, y 
Bo U f2 son bases para W, y W, respectivamente. Pero 


L(Bs U Bı U B2) = El (80 U Br) U (Bo U B2)) 


L(Bo U Bı) + L(Bo U Bo) 
= W, +W: 


Il 


por el ejercicio 12 de la sección 1.4. De aquí que 8o U 6, U £2 genera 
a W, + W, lo cual completa la demostración. W 


Como una consecuencia inmediata de este resultado, se tiene el si- 
guiente corolario de utilidad. 


Corolario. Sean W, y W, subespacios dimensionalmente finitos de un espacio 
vectorial V tales que V = W, + W.. Luego, V es la suma directa de W, 
y W: si y sólo si 


dim(V) = dim(W,) + dim(W.). 


Ejemplo 43. Sea c un elemento de un campo infinito F, sea W, el con- 
junto de todas las funciones constantes en P,(F), y defínase como 
W, = (f(x) E€Pa(F); f(c) = 0). Puede verse fácilmente que W, y Wo 
son subespacios de Pa (F) y que Pa(F) = W, @ W.. (Obsérvese que para 
cualesquiera f(x) € PA(F), g(x) = f(c) € W,, h(x) = f(x) — f(c) € Wa, 
y f(x) = g(x) + h(x).) Como la función constante p(x) = 1 claramen- 
te constituye una base para W,, se deduce del corolario anterior que 


dim(W,) = dim(P,(F)) — dim(W,) = (n+ 1) -— 1=mnm. 
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EJERCICIOS 


1. 


2. 


3. 


Decir sí las siguientes afirmaciones son verdaderas o falsas. 


(a) 
(b) 


(c) 
(d) 
(e) 
(£) 


(g) 
(h) 


(1) 


(j) 
(k) 


(1) 


El espacio vectorial cero no tiene base. 

Todo espacio vectorial generado por un conjunto finito tiene una 
base. 

Todo espacio vectorial tiene una base finita. 

Un espacio vectorial no puede tener más de una base. 

Si un espacio vectorial tiene una base finita, entonces el número de 
vectores en todas las bases es el mismo. 

La dimensión de P,(F') es n. 

La dimensión de Mmxn(F) es m +n. 

Suponer que V es un espacio vectorial dimensionalmente finito, que 
S, es un subconjunto linealmente independiente de V y que S, es un 
subconjunto de V que genera a V. Luego, S, no puede tener más 
elementos que Sz. 

Si S genera al espacio vectorial V, entonces todo vector en V puede 
escribirse como una combinación lineal de elementos de S de una 
sola manera. 

Todo subespacio de un espacio dimensionalmente finito” es dimensio- 
nalmente finito. 

Si V es un espacio vectorial de dimensión n, entonces V tiene exacta- 
mente un subespacio de dimensión O y exactamente un subespacio de 
dimensión n. 

Si W, y W: son subespacios dimensionalmente finitos de un espacio 
vectorial, entonces dim(W, + W,) = dim(W,) + dim(W.). 


Determinar cuáles de los siguientes conjuntos son bases para R*. 


(a) 
(b) 
(c) 
(d) 
(e) 


{(1, 0, —1), (2, 5, 1), (0, — 4, 3)) 

(Q, —4, 1), (0,3, —1), (6,0, —1)) 

(A, 2, —1), (1,0, 2), (2, 1, 1)) 

{(—1, 3, 1), (2, —4, —3), (—3, 8, 2)) 

{d, —3, —2), (—3, 1,3), (—2, —10, —2)} 


Determinar cuáles de los siguientes conjuntos son bases para P.(R). 


(a) 
(b) 
(c) 
(d) 
(e) 


(1 — x + 2x,2 42. 1 2x +t 4x} 

{1 +2x +x, 3 +x, xt} 

{1 + 4x — 2x, —2 + 3x — x’, —3 — 12x + 6x°} 
[—1 + 2x + 4x, 3 — 4x — 10x, —2 — 5x — 6x?) 
{1 +2x— x, 4— 2x +t x, —1 + 18x — 9x} 


¿Generan los polinomios x* — 2x? + 1, 4# —x +3 y 3x— 2 a Ps(R)? 
Justifique su respuesta. 


10. 


11,* 


12. 
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¿Es {(1, 4, —6), (1, 5, 8), (2, 1, 1), (0, 1, 0)) un subconjunto lineal- 
mente independiente de R?? Justifique su respuesta. 


Dar tres bases diferentes para F? y para M2,2(F). 
Los vectores x, 2, —3, 1), x = (1, 4, —2), xs = (-8, 12, —4), 
x, = (1, 37, —17), y xs = (—3, —5, 8) generan a R’. Encontrar un sub- 


conjunto de (x,, X2, Xs, X4, Xs} que sea una base para R?. 


Sea V el espacio vectorial que consta de todos los vectores de R* para los 
cuales la suma de las coordenadas es cero. Los vectores 


— 
Xi = (2, =3, 4, =5, 2), X2 = (—6, 9, —12, 15, —6), 
x, = (3, —2, 7, —9, 1), x= (2, —8, 2, —2, 6), 
X5 = (—1, 1, 2, 1, -3), Xe = (0, —3, —18, 9, 12), 
X: = (1, 0, —2, 3, —2), Xs = (2, =1, 1, —9, 7) 
generan a V. Encontrar un subconjunto de (x,, ... , Xs} que sea una base 


para V. 


Los vectores x, = (1, 1, 1, 1), x2= (0, 1, 1, 1), x= (0, 0, 1, 1), y 
xs = (0, 0, O, 1) forman una base para F*. Encontrar la única representa- 
ción de un vector arbitrario (a,, a», as, a,) en F* como combinación lineal 
de los vectores Xi, X:, Xs, Y Xa. 


Sea 
c a 


— 0 a , 
w= i(i p)ev: a DEPL 


Demostrar que W, y W: son subespacios de V y encontrar las dimensiones 
de W., Wo, W: + Wo, y W, N W2. 


V= Max (F), W, = (6 y V: ab,c€ r} 


Sea V un espacio vectorial de dimensión n y sea S un subconjunto de V 
que genera a V. 


(a) Demostrar que S contiene al menos n elementos. 
(b) Demostrar que un subconjunto de S es una base para V. (Tenga cui- 
dado de no suponer que $ sea finito.) 


Sean W, y W: subespacios de un espacio vectorial V de dimensiones m y n, 
respectivamente, donde m > n. Demostrar que dim(W,N W,<n y 
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13. 


14. 


17. 


18. 


19. 


20. 


21. 
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dim(W, + W.) < m + n. Dar ejemplos de subespacios de R3 donde cada 
desigualdad se convierta en igualdad. 


Sea (x, y) una base de un espacio vectorial V. Mostrar que tanto {x + y, 
x — y) como (ax, by) son bases para V, donde a y b son escalares arbi- 
trarios no nulos. 


Suponer que V es un espacio vectorial con una base [x1, X2, x3). Demostrar 
que {xı + X2 + Xs, X2 + Xs, X3} también es una base para V. 


El conjunto de soluciones para el sistema 


A + De +A =0 
2x, — 3x + xs =0 


es un subespacio de R”. Encontrar una base para este subespacio. 


Encontrar bases para los siguientes subespacios de F°: 


W, = { (a, A», Az, aa, as) € F5: a; = dz por d4 a 0} 


We = ((4,, az, as, 44, as) € F°: a, = as = a, a, + as = 0}. 


¿Cuáles son las dimensiones de W, y W,? 


El conjunto de todas las matrices de n x n e traza es igual a cero es 
un subespacio W de Man (F). (Ver Ejemplo 1.1.) Encontrar una base para 
W. ¿Cuál es la dimensión de W? 


El conjunto de todas las matrices triangulares de n x n es un subespacio 
W de Maxn(F). (Ver Ejercicio 12 de la Sección 2.3.) Encontrar una base 
para W. ¿Cuál es la dimensión de W? 


El conjunto de todas las matrices antisimétricas de n x n es un subespacio 
W de Muxn(F). (Ver Ejercicio 25 de la Sección 1.3.) Encontrar una base 
para W. ¿Cuál es la dimensión de W? 


(a) Sean W, y W, subespacios de un espacio vectorial V tales que 
V =W, @W-. Si £, y 82 son bases para W, y W,, respectivamente, 
demostrar que 8, N $. = Y y que £, U 82 es una base para V. 

(b) Recíprocamente, sean £, y fB: bases disjuntas para subespacios W, y 
W,, respectivamente, de un espacio vectorial V. Demostrar que si 


Pr U 82 es una base para V, entonces V = W, p W.. 


Completar la demostración del Teorema 1.9. 


22. 


23. 


24. 


25. 


1.7* 
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Sea W un subespacio de un espacio vectorial dimensionalmente finito V. 
Determinar la dimensión del espacio vectorial V/W, el espacio cociente de 
V módulo W. (Ver Ejercicio 29 de la Sección 1.3.) Justifique su respuesta. 


Encontrar una base para el espacio vectorial de sucesiones no nulas en un 
campo F. (Ver ejemplo 5.) 


Demostrar que si W, es un subespacio cualquiera de un espacio vectorial 
dimensionalmente finito V, entonces existe un subespacio W, de V: tal que 
V= W, Q W.. 


Demostrar que un espacio vectorial es dimensionalmente infinito si y sólo 
si contiene un subconjunto infinito linealmente independiente. 


SUBCONJUNTOS MAXIMOS LINEALMENTE INDEPENDIENTES 


En esta sección extenderemos algunos resultados importantes de la sec- 
ción 1.6 de manera que incluyan espacios vectoriales dimensionalmente 
infinitos. Nuestra meta principal es demostrar que todo espacio vectorial 
tiene una base. Este resultado es fundamental para el estudio de espacios 
vectoriales dimensionalmente infinitos, ya que a menudo es extremada- 
mente difícil construir explícitamente una base para tales espacios. 

La dificultad que surge al expandir los teoremas de la sección anterior 
a espacios dimensionalmente infinitos es que el principio de inducción 
matemática, que jugó un papel fundamental en muchas de las demostra- 
ciones de la sección 1.6, ya no es válido. En vez de ello, utilizaremos un 
principio más general llamado principio de maximidad, el que requiere 
de la siguiente terminología. 


Definición. Sea F una familia de conjuntos. Un miembro M de F se llama máxi- 


mo (en relación con la inclusión de conjunto), si ningún miembro de F 
contiene propiamente a M. 


Ejemplo 44. Sea F la familia de todos los subconjuntos de un conjunto 
no vacío S (F se denomina conjunto potencia de S). Se puede ver fácil- 
mente que S es el elemento máximo de F. 


Definición. Una colección de conjuntos € se denomina cadena si, para cada 


par de conjuntos A y B en C, se tiene que ACBoBCA. 


Ejemplo 45. Sea A, el conjunto que consta de los enteros 1, 2, ... , A. 
Entonces € = {4 a: n= 1, 2, 3,...} es una cadena; de hecho Am C An 
si y sólo si m < n. 
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Con esta terminología ya podemos expresar el principio de maxi- 
midad. 


Principio de Maximidad. Sea F una familia de conjuntos. Si, para cada cade- 
na © C F, existe un miembro de F que contiene a cada uno de los miem- 
bros de C, entonces F contiene un elemento máximo. 


Como el principio de maximidad garantiza la existencia de elementos 
máximos en una familia de conjuntos, será útil reformular la definición 
de una base en términos de la propiedad de maximidad. Demostraremos 
posteriormente que esta reformulación es equivalente a la definición origi- 
nal de base. 


Definición. Sea S un subconjunto de un espacio vectorial V. Un subconjunto 
máximo linealmente independiente de S es un subconjunto B de S que 
satisface las siguientes condiciones: 


(a) B es linealmente independiente. 
(b) Cualquier subconjunto de S que contenga propiamente a B es 
linealmente dependiente. 


Ejemplo 46. El ejemplo 16 muestra que {x° — 2x? — 5x — 3, 3x — 
— 5x? — 4x — 9) es un subconjunto máximo linealmente independiente 
de 


= (2x4 — 2x? + 12x — 6, xX? — 2x? — 5x — 3, 3x — 5x? — 4x — 9) 


en P,(R). En este caso, sin embargo, se puede demostrar fácilmente que 
cualquier subconjunto de dos elementos de S es un subconjunto máximo 
linealmente independiente de S. De aquí que los subconjuntos máximos li- 
nealmente independientes de un conjunto no necesariamente son únicos. 


Una base 8 para un espacio vectorial V es un subconjunto máximo li- 
nealmente independiente de V, ya que: 


(a) £ es, por definición, linealmente independiente. 
(b) Six€ V, x é f, entonces 8 U {x} es linealmente independiente 
de acuerdo con el lema del Teorema 1.10, puesto que L(8) = V. 


Nuestro siguiente resultado muestra que la recíproca de este argumento 
también es verdadera. 


Teorema 1.14. Sea S un subconjunto de un espacio vectorial V tal que S gene- 
ra a V, y sea B un subconjunto máximo linealmente independiente de S. 
Entonces B es una base para V. 


DEMOSTRACIÓN. Puesto que £ es linealmente independiente, es suficiente 
demostrar que 8 genera a V. Supóngase que S C L(£8); entonces existe 
x€ S tal que x Æ L(8). Pero entonces el lema del Teorema 1.10 implica 
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que 8 U {x} es linealmente independiente, lo que es una contradicción a 
la maximidad de 8. Luego entonces $ C L(f8). Por tanto, como L(S) = V, 
se tiene del ejercicio 11 de la sección 1.4 que L(8) = V. E 


Corolario. Un subconjunto B de un espacio vectorial V es una base para V 
si y sólo si B es un subconjunto máximo linealmente independiente de V. 


En vista de nuestro corolario anterior, podemos llegar a asegurar que 
todo espacio vectorial tiene una base al demostrar que todo espacio vecto- 
rial contiene un subconjunto máximo linealmente independiente. Este re- 
sultado se deduce de una manera inmediata a partir de nuestro siguiente 
teorema. 


Teorema 1.15. Sea S un subconjunto linealmente independiente de un espacio 
vectorial V. Existe un subconjunto máximo linealmente independiente de 
V que contiene a S. 


DEMOSTRACIÓN. Sea F la familia de todos los subconjuntos linealmente 
independientes de V que contienen a S. Utilizaremos el principio de maxi- 
midad para demostrar que F contiene un elemento máximo. Con el objeto 
de aplicar el principio de maximidad debemos demostrar que si © es yna 
cadena en F, entonces existe un miembro U de F que contiene a cada 
miembro de €. Demostraremos que U, la unión de los miembros de C, es 
el conjunto deseado. Como es evidente que U contiene a cada miembro 
de C, basta con demostrar que U € F, es decir, que U es un subconjunto 
linealmente independiente de V que contiene a S. Ahora bien, cada ele- 
mento de C es un subconjunto de V que contiene a $; de aquí S C U C V. 


Para demostrar que U es linealmente independiente, sean u;, ... , Uy Vec- 
tores en U y c,, ... , Cn escalares tales que ciu, + ... + Chu, = 0. Como 
u;€ U para i= 1,..., n, existen conjuntos A; en € tales que u; € A. 
Pero como € es una cadena, uno de los conjuntos A, ... , ÁA,, por ejem- 
plo Ax, contiene a los demás. Entonces u,, ... , Un € A; parai = 1,..., N. 
Sin embargo, A, es un conjunto linealmente independiente, de manera que 
Cila + ... + Cauna = 0 implica que c, = ... = C, =0. Por lo tanto, U 


es linealmente independiente. 

El principio de maximidad implica que F contiene un elemento máxi- 
mo, y se ve fácilmente que este elemento máximo es un subconjunto 
máximo linealmente independiente de V que contiene a S. I 


Corolario. Todo espacio vectorial tiene una base. 


Puede demostrarse, de una manera semejante a la del Corolario 3 del 
Teorema 1.11, que toda base para un espacio vectorial dimensionalmente 
infinito tiene la misma cardinalidad. (Consultar, por ejemplo, a N. Jacob- 
son, Lecturas sobre Algebra Lineal, MM, pág. 154, D. Van Nostrand Com- 
pany, Nueva York, 1964.) 
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Los ejercicios 2 a 5 extienden otros resultados de la sección 1.6 para 
incluir espacios dimensionalmente infinitos. 


EJERCICIOS 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Toda familia de conjuntos contiene un elemento máximo. 

(b) Toda cadena contiene un elemento máximo. 

(c) Si una familia de conjuntos tiene un elemento máximo, entonces tal 
elemento máximo es único. 

(d) Si una cadena de conjuntos tiene un elemento máximo, entonces tal 
elemento máximo es único. 

(e) Una base de un espacio vectorial es un subconjunto máximo lineal- 
mente independiente de ese espacio vectorial. 

(f£) Un subconjunto máximo linealmente independiente de un espacio vec- 
torial es una base para tal espacio vectorial. 


Sea W un subespacio de un espacio vectorial V (no necesariamente dimen- 
sionalmente finito). Demostrar que cualquier base para W es un subcon- 
junto de una base para V. 


Demostrar la siguiente versión dimensionalmente infinita del Teorema 1.9: 
Sea 8 un subconjunto de un espacio vectorial V dimensionalmente infinito. 
Entonces 8 es una base para V si y sólo si para cada vector y no nulo en 
V existen vectores únicos x,,..., Xx.» en 8 y escalares no nulos únicos 
Cis... , Cn tales que y = cix + ... + CrXn. 


Demostrar la siguiente generalización del Teorema 1.10: Sean S, y S, sub- 
conjuntos de un espacio vectorial V tales que S, C S,. Si S, es linealmente 
independiente y S, genera a V, entonces existe una base 8 para V tal que 
Sı CB CS». Sugerencia: Aplicar el principio de maximidad a la familia 
de todos los subconjuntos linealmente independientes de S. que contienen 
a $, y proceder como se hizo en la demostración del Teorema 1.15. 


Demostrar la siguiente generalización del Teorema 1.11. Sea 8 una base 
para un espacio vectorial V y sea S un subconjunto linealmente indepen- 
diente de V. Existe un subconjunto S, de 8 tal que S U S, es una base 
de V. 


INDICE DE DEFINICIONES PARA EL CAPITULO 1 


Base, 41 Cadena, 57 
Base estándar para F", 41 Co-conjunto, 24 


Combinación lineal, 25 

Dependencia lineal, 37 

Diagonal, 18 

Dimensión, 46 

Ecuación de interpolación de 
Lagrange, 49 

Elemento máximo de una familia 
de conjuntos, 57 

Escalar, 7 

Espacio cociente, 24 

Espacio dimensionalmente 
finito, 46 

Espacio vectorial, 6 

Espacio vectorial cero (nulo), 15 

Función impar, 23 

Función par, 23 

Grado de un polinomio, 9 

Independencia lineal, 38 

Inverso aditivo, 12 

Ley de cancelación, 11 

Matriz, 8 

Matriz antisimétrica, 23 


Indice de definiciones 61 


Matriz cero, 8 

Matriz diagonal, 18 

Matriz simétrica, 17 

Matriz triangular superior, 22 

Polinomio, 9 

Polinomio cero, 9 

Polinomio de Lagrange, 49 

Subconjunto máximo linealmente 
independiente, 58 

Subespacio, 16 

Subespacio cero (nulo), 16 

Subespacio generado por los 
elementos de un conjunto, 32 

Sucesión, 11 

Suma directa, 20 

Suma de subconjuntos, 19 

Transpuesta, 17 

Traza, 18 

Vector, 7 

Vector cero, 11 

Vector columna, 8 

Vector renglón, 8 


Capítulo 2 


Transformaciones lineales 
y matrices 


2.1 


En el capítulo 1 desarrollamos la teoría de espacios vectoriales abstractos 
con bastante detalle. Ahora es natural considerar a aquellas funciones defi- 
nidas en espacios vectoriales que en cierto sentido “conservan” la estruc- 
tura; estas funciones especiales se denominan “transformaciones lineales” 
y son abundantes en las matemáticas puras como en las aplicadas. En el 
cálculo, las operaciones de diferenciación e integración nos proporcionan 
dos de los ejemplos más importantes de transformaciones lineales (ver 
ejemplos 1 y 2). Estos dos ejemplos nos permiten reformular muchos de 
los problemas de ecuaciones diferenciales e integrales en términos de trans- 
formaciones lineales en espacios vectoriales particulares (ver las seccio- 
nes 2.7 y 5.2). 

En geometría, las rotaciones, reflexiones y proyecciones (ver ejem- 
plos 5, 6 y 7) nos proporcionan otra clase de transformaciones lineales, 
las que utilizaremos posteriormente para estudiar los movimientos rígidos 
en Re (sección 7.8). 

En los capítulos restantes veremos ejemplos adicionales de transforma- 
ciones lineales en las ciencias físicas y sociales. 

A lo largo de este capítulo supondremos que todos los espacios vecto- 
riales están definidos sobre un campo ordinario F. 


TRANSFORMACIONES LINEALES, ESPACIOS 
NULOS Y RANGOS a 


En esta sección consideraremos un gran número de ejemplos de trans- 
formaciones lineales, muchas de las cuales serán estudiadas con más de- 
talle en secciones posteriores. 


Definición. Sean V y W espacios vectoriales (sobre F). Una función T: V => W 


se llama transformación lineal de V en W si para toda x, yEV y CEF 
tenemos que 
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(a) T(x +y)=TG) + T(y). 
(b) T(cx) = cT(x). 


A menudo denominaremos a T simplemente lineal. El lector deberá 
verificar los siguientes hechos sobre la función T; VW. 


1. Si T es lineal, entonces T(0) = 0. 
T es lineal si y sólo si T(ax + y) = aT(x) + T(y) para toda 
x, JEVya€rF. 

3. Tes lineal si y sólo si para x,,...,x€EVya,..., 41€ F te- 
nemos que 


0> aixi) = S a;l (xi). 


Generalmente utilizaremos la propiedad 2 para demostrar que una 
transformación dada es lineal. 


Ejemplo 1. Sea V=P,(R) y W = Paa (R) y defínase T: V— W me- 
diante T(f) = f', donde f' es la derivada de f. Para demostrar que T es 
lineal, sean g y h vectores en P,(R) y a€ R. Tenemos que T(ag + h) = 
= (ag + hy = ag! + h' = aT(g) +T(A). Entonces, de acuerdo con la 
propiedad 2, T es lineal. 


Ejemplo 2. Sea V = C(R) el espacio vectorial de funciones continuas 
de variable real en R. Sean a, b€ R,a<b y defínase T: V— R me- 


b 
diante T(f) = | f(t)dt para toda f€ V. Entonces, por las propiedades 


a 
elementales de las integrales, T es una transformación lineal. 


Dos ejemplos muy importantes de'transformaciones lineales que pue- 
den aparecer a menudo en el resto del libro y que, por tanto, merecen 
tener una notación propia, son la transformación identidad y la transfor- 
mación cero. 

Para espacios vectoriales V y W (sobre F) definimos la transformación 
identidad | : V => V mediante ly (x) = x para toda x€ V y la transfor- 
mación cero To: V—W por To(x) = O para toda x€ V. Es evidente que 
ambas transformaciones son lineales. A menudo escribiremos | en vez 
de l. 

Veremos ahora algunos ejemplos' adicionales de transformaciones li- 
neales. 


Ejemplo 3. Defínase 
T: R R? por T(a,, a.) = (2a, + a», a). 
Para demostrar que T es lineal, sean 


x, yE RE x= (bı, b»), y = (d, də), y sea c€rF. 
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Como 
cx + y= (cb, +d, cb, + do), 
tenemos 
T(cx + y) = (2(cb, + d,) + cb; + da, cb, + d,). 
También 


cT(x) + T(y) = c(2b, + b,, b,) + (Qd,;+ dz, d,) 
(2cb, + cb, + 2d, + d», cb, + dı) 
(2(cb, + di) + cb, + dz, cb, + di). 


j 


li 


Por lo tanto, T es lineal. 


Ejemplo 4. Defínase T: Mmxn(F)— Mmxn(F) mediante T(4) = A', 
donde At es tal como se definió en la Sección 1.3. Entonces, T es una 
transformación lineal por el ejercicio 3 de la Sección 1.3. 


Como veremos en las Secciones 7.7 y 7.8, las aplicaciones del álgebra 
lineal a la geometría son vastas y variadas. La razón principal de esto es 
que la mayor parte de las transformaciones geométricas son lineales. Tres 
transformaciones particulares que ahora consideraremos son la rotación, 
la reflexión y la proyección. Dejaremos al lector las demostraciones de 
linealidad. 


Ejemplo 5. Para 0 < 0 < 2r definamos To: R?— R? mediante 
T.(a,, az) = (a, cos 0 — a sen 0, a, sen Ó + a, cos 0). 


Tə se denomina rotación en 0. (Ver Fig. 2.1(a).) 


Ejemplo 6. Defínase T: R?*=>R? mediante T(a,, a») = (ai, —a2). T se 
denomina reflexión en torno al eje x. (Ver Fig. 2.1(b).) 


Ejemplo 7. Defínase T: R?— R? mediante T(a,, a2) = (a, 0). T se de- 

nomina proyección sobre el eje x. (Ver Fig. 2.1(c).) Nótese que si hacemos 

W, = [(a, 0): a€ R} yW: = ((0, a): a€ R} entonces R? = W, QS W., 
Tx) 
9 


>< 


(a) (b) (c) 


figura 2.1 
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por lo que para toda x€ R? existen vectores únicos x, € W, y x.€ Wa 
tales que x= x, + x: y T(x) =x. 
El ejemplo 7 sugiere la siguiente definición. 


Definición. Sean V un espacio vectorial y W, un subespacio de V. Una función 
T: V>V se llama proyección sobre W, si 


(a) Existe un subespacio W, tal que V = W, QW: 
(b) Para x = x, + Xz, donde x, € W, y X. € Wo, tenemos T(x) = X.. 


Se deja como ejercicio para el lector demostrar que T es lineal y que 
W, = {x: T(x) =x}. 

Ahora supóngase que existe un subespacio W’, =W, tal que V = 
W, Ð W/. Defínase U: V— V mediante U(x) = x, donde x = x, + X's, 
LEW, y x2€ W.. Entonces, U es otra proyección sobre W, y de nuevo 
W, = {x: U(x) = x}. Por ejemplo, en el Ejemplo 7 sea 


' = {(a, a): a€ R}, 
tal que 
(a,, a.) = (a, — az, 0) + (a, a») y U(a,, a) = (a, — a», 0). 


Entonces existen tantas proyecciones en W, como subespacios en W. 
que satisfacen V = W, @ W,. Veremos en el Capítulo 7 que la proyec- 
ción descrita en la figura 2.1(c) es la proyección “natural” a ser estudiada. 
Este tipo de proyección se llamará “proyección ortogonal” y está deter- 
minada de manera única por el subespacio W,. 

En el Ejercicio 14 de la Sección 2.3 se dará una caracterización de las 
proyecciones, la que nos permitirá determinar fácilmente si una transfor- 
mación lineal es o no una proyección. 

Ahora pondremos atención a dos conjuntos muy importantes asociados 
con las transformaciones lineales: el “rango” y el “espacio nulo”. La de- 
terminación de estos conjuntos nos permitirá examinar más de cerca las 
propiedades intrínsecas de una transformación lineal. 


Definiciones. Sean V y W espacios vectoriales y sea T: V-W lineal. Defini- 
mos al espacio nulo (o kernel) N(T) de T como el conjunto de todos los 
vectores x en V tal que T(x) = 0; es decir, N(T) = {x€ V: T(x) = 0). 
Definimos al rango (o imagen) R(T) como el subconjunto de W que consta 
de todas las imágenes (bajo T) de los elementos de V; es decir, R(T) = 


(TOGO: xE V}. 


Ejemplo 8. Sean V y W espacios vectoriales y sean i: V—>V y To: 
V => W respectivamente las transformaciones identidad y cero, tal como 
se definieron anteriormente. Entonces N(I) = {0}, R(I) = V, N(T,) = V 
y R(To) = (0). 
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Ejemplo 9. Sea T: R*—>R* definida mediante T(a,, az, as) = (a, — a», 
2a,). Se deja como ejercicio verificar que N(T) = {(a, a, 0): a€ R} y 
R(T) =R2, 


En el ejemplo 7 se ve fácilmente que los subespacios W, = R(T) y 
W: = N(T). El teorema siguiente nos dice que éste es el caso para todas 
las proyecciones. 


Teorema 2.1. Sea V un espacio vectorial y W, un subespacio de V. Sea T una 
proyección sobre W,, y sea W., tal como en la def.nición de proyección. 
Entonces 

WERO) y W=NC). 


DEMOSTRACIÓN. Como se observó anteriormente, W, = ([x: T(x) = x). 
Por lo tanto, W, C R(T). Si xER(T), entonces: x = T(y) para alguna 
y EV. Pero y = y, + yo, donde y, EW, y y. EW, y entonces x = y,. Por 
lo tanto, W, = R(T). 

Como es evidente que W, C N(T), únicamente necesitamos demostrar 
que N(T) C W.. Con este fin, sea xE€N(T). Entonces x= x, + x, con 
XxX EW, y x2€EW.. Así, 0 = T(x) = x, y por lo tanto x= x. €W.. E 


Este teorema nos dice que W. queda determinada de manera única por 
la proyección de T sobre W,. Además, como T es una proyección sobre 
su rango, utilizaremos sencillamente el término “proyección” sin mencio- 
nar al subespacio W4. 

Acabamos de observar en el caso en que T es una proyección que N(T) 
y R(T) son subespacios de V. Puede obtenerse el mismo resultado con 
cualquier transformación lineal. 


Teorema 2.2. Sean V y W espacios vectoriales y T: W=>W lineal. Entonces 
N(T) y R(T) son subespacios de V y W, respectivamente. 


DEMOSTRACIÓN. Para aclarar la notación, usaremos los símbolos 0y y 
Ow para denominar, respectivamente, a los vectores cero de V y W. 

Como T(0y) = Oy, tenemos que Oy € N(T). Sean x,EN(T) y 
cE F. Entonces T(x + y) = T(x) + TO) = 0w + 0w = 0w, y T(cx) = 
cT(x) = cOy = Ow. Por lo tanto x + yEN(T) y cx€N(T), de manera 
que N(T) es un subespacio de V. 

Como T(0y) = Ow, tenemos que Oy € R(T). Ahora sean x, y€ R(T) 
y c EF. Entonces, existen v y w en V tales que T(v) =x y T(w)'= y. 
Así, T(v + w) = T(v) + T(w) =x + y, y T(cv) = cT(v) = cx. Por lo 
tanto, x + yER(T) y cxER(T), de manera que R(T) es un subespacio 
de W. E 


Tal como en el Capítulo 1, mediremos el “tamaño” de un subespacio 
por su dimensión. Los dos subespacios anteriores son tan importantes que 
dedicaremos atención especial a sus dimensiones respectivas. 
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Definiciones. Sean V y W espacios vectoriales y sea T: V—W lineal. Si 
N(T) y R(T) son dimensionalmente finitos, entonces definimos la nulidad 
de T, expresada como nulidad(T), y el rango de T, expresado como ran- 
go(T), como las dimensiones de N(T) y R(T), respectivamente. 


Reflexionando sobre la acción de una transformación lineal, vemos in- 
tuitivamente que mientras más grande es la nulidad menor es el rango. 
En otras palabras, mientras más vectores van a dar al cero, menor es el 
rango. El mismo razonamiento nos dirá que mientras más grande sea 
el rango, menor es la nulidad. Este balance entre el rango y la nulidad se 
hará más preciso en el teorema siguiente. 


Teorema 2.3. Sean V y W espacios vectoriales y sea T: V—>W lineal. Si V 
es dimensionalmente finito, entonces nulidad(T) + rango(T) = dim(V). 


DEMOSTRACIÓN. Supóngase que dim(V) = n, y sea (x,,..., xx) una 
base para N(T). Por el corolario del Teorema 1.12 podemos extender 
(A, ..., Xx} a una base 8 = (x,, ... , Xn} para V. Demostraremos que 


el conjunto S = {T (xXx), ... , T(xn)) es una base para R(T). 
Primero demostraremos que S genera a R(T). Sea y ER(T). Entonces 
existe x EV tal que y = T(x). Como £8 es una base para V, tenemos que 


n 
x= D axi para algunas a,, ... , an EF. 
í=-1 


Como T es lineal se tiene que 


y=T()=XaTx)= Y aT(x) ELS) 


+=1 i=k+1 
La última igualdad se obtiene de que x,, ... , xx EN(T). 
Ahora demostraremos que S es linealmente independiente. Supóngase 
que 
” 
D biT(xí) =0 para bx. ..., bn EF. 
i=k+1 


De nuevo, utilizando el hecho de que T es lineal, tenemos que 


e T( 5 bix;) = 0. 


i=k+1 


Entonces 


$ bixi EN(T). 


i=k+1 


Por lo tanto existen cı, ... , c EF tales que 


n k k n 
5 b;x; = 5 CiXi O bien 5 (—ci)xi + > bixi; = 0. 


i=kķ+1 i=1 4-1 1=k+1 
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Como £ es una base para V, tenemos que b; = O para toda i. Por lo tan- 
to, S es linealmente independiente. MW 


La demostración anterior permite obtener el corolario siguiente. 


Corolario. Sean V y W espacios vectoriales y sea T: V—W lineal. Si V tiene 
una base B = [X,, ... , Xa}, entonces R(T) = L(T(8)) = L({T(x.), ..., 
T(xa))). 


Este corolario nos dice que la imagen de una base para el dominio de 
una transformación lineal es un conjunto generador para el rango de la 
transformación. Por lo tanto, este corolario proporciona un método para 
encontrar una base para el rango de una transformación lineal. Empleare- 
mos esta técnica en el ejemplo siguiente. 


Ejemplo 10. Defínase la transformación lineal T: P(R)— M:x:(R) 


mediante 
(0) -1Q) 0 
LURS ( 0 Ko): 


Como £ = {1, x, x?} es una base para P¿(R), tenemos 


R(T) = L (T(8)) = LETC), T(x), TG) 
46 1) (o 0) (5 9) 
“(4 1) Co o) 


Entonces, hemos encontrado una base para R(T) y vemos que 


rango(T) = 2. En virtud del Teorema 2.3 tenemos que nulidad(T) + 
2 = 3, y entonces nulidad(T) = 1. 


El lector debería repasar los conceptos de “uno-a-uno” y “sobreyec- 
tividad” los cuales se encuentran en el Apéndice B, pues, interesantemen- 
te, para una transformación lineal ambos conceptos están íntimamente 
ligados con el rango y la nulidad de la transformación. Esto quedará de- 
mostrado en los dos teoremas siguientes. 


Teorema 2.4. Sean V y W espacios vectoriales y sea T: V —W lineal. Enton- 
ces T es uno-a-uno si y sólo si N(T) = {0}. 


DEMOSTRACIÓN. Supóngase que T es uno-a-uno y que x €N(T). Entonces 
T(x) = 0 = T(0). Como T es uno-a-uno, tenemos que x = O y por tanto 


N(T) = (0). 
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Ahora supóngase que N(T) = {0} y que T(x) = T(y). Entonces 
0 = T(x) — TGy) = T(x — y). Por lo tanto, x — yEN(T) = {0} y en- 
tonces x — y = 0, o sea x = y. Esto significa que T es uno-a-uno. E 


El lector debe observar que el Teorema 2.4 nos permite concluir que 
la transformación definida en el Ejemplo 10 no es uno-a-uno. 

Sorpresivamente, las condiciones para que una transformación sea uno- 
a-uno y sobreyectiva son equivalentes en un caso especial de importancia. 


Teorema 2.5. Sean V y W espacios vectoriales de dimensiones iguales (finitas) 


y sea T: W—>W lineal. Entonces T es uno-a-uno si y sólo si T es sobre- 
yectiva. 


DEMOSTRACIÓN. Del Teorema 2.3 tenemos que 

nulidad(T) + rango(T) = dim(V). 
Ahora, mediante el uso del Teorema 2.4, tenemos que T es uno-a-uno si 
y sólo si N(T) = {0}, si y sólo si nulidad(T) = O, si y sólo si rango(T) = 
dim(V), si y sólo si rango(T) = dim(W), si y sólo si dim(R(T)) = 


dim(W). En virtud del Teorema 1.12 esta igualdad es equivalente a 
R(T) = W—la definición de T si ésta es sobreyectiva. MW 


La linealidad de T en los Teoremas 2.4 y 2.5 es esencial puesto que 
es fácil construir ejemplos de funciones de R en R que no sean uno-a-uno 
pero que sean sobreyectivas, y viceversa. 

Los siguientes dos ejemplos hacen uso de los teoremas anteriores para 
ver si una transformación lineal dada es uno-a-uno o sobreyectiva. 


Ejemplo 11. Defínase 


T: P.(R)>P,(R) mediante T(f)(x) = 2f (x) + SADa 


0 


Ahora 
R(T) = ECTOD, T(x), TCE) = L((3x, 2 + "2x2, 4x + x7)). 


Por lo que rango(T) = 3. Como dim(P,(R)) = 4, T no es sobreyectiva. 
Del Teorema 2.3, nulidad(T) + 3 = 3; por tanto, nulidad(T) = 0 y en- 
tonces N(T) = (0). Luego, de acuerdo con el Teorema 2.4, T es uno-a-uno. 


Ejemplo 12. Defínase 


T: F>F mediante T(a,, a.) = (a. +a, a). 


Es fácil comprobar que N(T) = (0); entonces T es uno-a-uno, por lo que 
el Teorema 2.5 nos dice que T debe ser sobreyectiva. 
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Nuestro siguiente teorema proporciona una caracterización de las trans- 
formaciones lineales uno-a-uno como aquellas transformaciones que conser- 
van la independencia lineal. 


Teorema 2.6. Sean V y W espacios vectoriales, y sea T: V —W lineal. Enton- 
ces T es uno-a-uno si y sólo si T lleva subconjuntos linealmente indepen- 
dientes de V a subconjuntos linealmente independientes de W. 


DEMOSTRACIÓN. Ejercicio. 


Corolario. Sean V y W espacios vectoriales y sea T: W—=>W una transforma- 
ción lineal uno-a-uno. Supóngase que S es un subconjunto de V. Entonces 


S es linealmente independiente si y sólo si T(S) es linealmente indepen- 
diente 


DEMOSTRACIÓN. Ejercicio. 


Ejemplo 13. Defínase 


T: P.(R)=>R*" mediante T(a, + aix + ax?) = (ao, a, a»). 


Se ve claramente que T es uno-a-uno. Sea S = {2 — x + 3x2, x + x, 1 — 
2x°}. Entonces S es linealmente independiente en P.(R) si y sólo si 


T($) = (2, —1, 3), (0, 1, 1), (1, 0, —2)) 


es linealmente independiente en R?. 


En el Ejemplo 13 transferimos un problema del espacio vectorial de 
los polinomios a un problema en el espacio vectorial de las ternas (3-di- 
mensionales). Esta técnica será explotada después más ampliamente. 

Una de las propiedades más importantes de las transformaciones linea- 
les es que quedan completamente definidas por su acción sobre una base. 
Este resultado, que se obtiene del siguiente teorema y su corolario, se 
utilizará frecuentemente a lo largo del libro. 


Teorema 2.7. Sean V y W espacios vectoriales y supóngase que V es un 


espacio vectorial dimensionalmente finito con una base {Xi ... , Xa}. Para 
cualquier subconjunto ([y,, ... , yn) de W existe exactamente una transfor- 
mación lineal T: V—>W tal que T(x,) = y, parai=1,...,n. 


DEMOSTRACIÓN. Sea x €V. Entonces 


n 


x= > AiXi, 
i=1 
donde a,, ... , a, son escalares únicos. Defínase 


T: V>W mediante T(x) = Y ajy;. 


i=1 
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(a) T es lineal, pues supóngase que u, v €V y d EF. Entonces pode- 
mos escribir 


n n 
u= Y bix, y v=XCix;. 
i-1 


i=1 


Ahora bien, 


du + v = $ (db; + ci) x. 
i=1 


t= 


Entonces 


T(du + v) = È (db; + c:)yı = d$ byi + $ ciy: = dT(u) + T0). 


i=1 í-1 t=1 


(b) Es evidente que 
T(xi) = yi para i= 1,..., N. 


- (c) T es única, porque supóngase que U: V—>W es lineal y 
U(x:) = y; para i = 1,..., n. Entonces para xEV con 


n 
x= Y a;x; 
í=1 


tenemos 
n n 
U(x) = X aU(x;¡) = Y ayi = T(x). 
įi=1 í=1 
Por lo tanto U = T. B 


Corolario. Sean V y W espacios vectoriales y supóngase que V es dimensional- 
mente finito con una base [X,, ... , Xn}. Si U, T: V—W son lineales y 
U(x:) = T(x¡) parai = 1,..., n, entonces U = T. 


Ejemplo 14. Defínase T: R? — R? mediante T(a,, az) = (2a: — a,, 3a,), 
y supóngase que U: R? — R? es lineal. Si sabemos que U(1, 2) = (3, 3) y 
U(1, 1) = (1, 3), entonces U = T. Esto se deduce del corolario y del he- 
cho de que ((1, 2), (1, 1)) es una base para R?. 


EJERCICIOS 


l. Decir si las siguientes afirmaciones son verdaderas o falsas. De aquí en 
adelante, V y W son espacios vectoriales dimensionalmente finitos (sobre 
F) y T es una función de V en W. 


(a) Si T es lineal, entonces T conserva las sumas y productos por escala- 
lares. 


(b) Si T(x + y) = T(x) + T(y) entonces T es lineal. 
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(c) Tes uno- a-uno si y sólo si N(T) = (0). 

(d) Todas las proyecciones deben ser lineales. 

(e) Si T es lineal, entonces T(0y) = Ow. 

(f) Si T es lineal, entonces nulidad(T) + rango(T) = dim(W). 

(g) Si T es lineal, entonces lleva subconjuntos linealmente independien- 
tes de V a subconjuntos linealmente independientes de W. 

(h) SiT, U: V—W son lineales y concuerdan en una base de V, enton- 
ces T = U. 

(i) Dados x,, x2€V y )Yr y2€W, existe una transformación lineal 
T: V>W tal que T(x,) = y, y T(x2) = y2 


Para los ejercicios 2 a 6, demostrar que T es una transformación lineal y encontrar 
bases para N(T) y R(T). Luego, calcular la nulidad y el rango de T y verificar 
el Teorema 2.3. Finalmente, emplear los teoremas adecuados de esta sección para 
determinar si T es uno-a-uno o sobreyectiva. 


2. T: RR? T(a,, a2, as) = (a, — az, 2a3). 
3. T: RR’; T(a,, a) = (a, + a, 0, 2a, — a»). 


Qi Mi a) = g — (12 l3 t E 


4. T: Masa (E) > Maal P); T (G @22 (2 0 0 


5. T: PAR) >PAR); T(60) = xf(x) + F(x). 
6. T: Main > F; T(4) = tr(4). Recuérdese que 


(A) = $ As. 


t=1 
7. Verificar los enunciados 1, 2 y 3 de la página 64. 
8. Verificar que las transformaciones definidas en los Ejemplos 5, 6 y 7 son 
lineales. 
9. Para las siguientes T: R? — R?, decir por qué T no es lineal. 
(a) T(a,, az) = (1, a2) 


(b) T(a,, a) = (a,, a,) 

(c) T(m, a.) = (sen a, 0) 
(d) T(a,, a) = (|a|, a) 
(e) T(a,, a) = (a, + 1, a) 


10. Supóngase que T: R?— R? es lineal y que T(1, 0) = (1, 4) y TU, 1) = 
(2, 5). ¿Qué es T(2, 3)? ¿T es uno-a-uno? 


11. Demostrar que existe una transformación lineal T: R?— R! tal que T(1, 1) 
= (1, 0, 2) y T(2, 3) = (1, —1, 4). ¿Qué es T(8, 11)? 
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12. 


16. 


18. 


19. 


20. 


21. 


22. 


23. 
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¿Existe una transformación lineal T: R?— R? tal que T(1, 0, 3) = (1, 1) 
y T(72, 0, —6) = (2, 1)? 


Demostrar el Teorema 2.6 y su corolario. 


Supóngase que T es una proyección en un subespacio W de un espacio vec- 
torial V. Demostrar que W = (x€V: T(x) = x}. 


Recordando la definición de P(R) dada en la Sección 1.2, defínase 
T: P(R)>P(R) y Tf)(x) = f Food. 
0 


Demostrar que T es uno-a-uno pero no sobreyectiva. 


Sean V y W espacios vectoriales dimensionalmente finitos y T: V-—>W 
lineal. 


(a) Demostrar que si dim(V) < dim(W), entonces T no puede ser so- 
breyectiva. 

(b) Demostrar que si dim(V) > dim(W), entonces T no puede ser uno- 
a-uno. 


Dar un ejemplo de una transformación lineal T: R?— R? tal que N(T) = 
RM. 


Dar un ejemplo de transformaciones lineales diferentes T y U tales que 
N(T) = N(U) y R(T) = R(U). 


Sean V y W espacios vectoriales con subespacios V, y W,, respectivamente. 
Si T: VW es lineal, demostrar que T(V,) es un subespacio de W y 
(xEV: T(x) EW,) es un subespacio de V. 


Sea W un subespacio de un espacio vectorial dimensionalmente finito V. 
Demostrar que existe una proyección sobre W. 


Sean V y W espacios vectoriales y sea T: VW-—>W lineal. Sea Ur > yx) 
un subconjunto linealmente independiente de R(T). Si S = (x,,..., x4} se 
selecciona de tal manera que T(x;) = y; para i=1,..., k, demostrar que 


S es linealmente independiente. 


Sea T: R*>R lineal. Demostrar que existen escalares a, b y c tales que 
T(x, y, z) = ax + by + cz para toda (x, y, z) ER?. ¿Se puede generalizar 
este resultado para T: F° — F? Enunciar y demostrar un resultado semejan- 
te para T: P — P, 


Sea T: R*— R lineal. Describir geométricamente las posibilidades para el 
espacio nulo de T. Sugerencia: Usar el Ejercicio 22. 


24. 


25. 


26. 


27. 


2.2 
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Sea V un espacio vectorial y sea T: V— V lineal. Se dice que un subespa- 
cio W de V es T-invariante si T(x) EW para toda x €W, es decir, T(W) C W. 


(a) Demostrar que los subespacios {0}, V, R(T) y N(T) son todos T-in- 
variantes. 

(b) Si W es un subespacio T-invariante de V, defínase a Ty: W -> W 
mediante Tw(x) = T(x) para toda x€ W. Demostrar que Ty es li- 
neal. 

(c) SiT es una proyección sobre W, demostrar que W es T-invariante y 
que Tw = lw- 

(d) Si V=R(T) BW y W es T-invariante, demostrar que W C N(T). 
Demostrar también que si V es dimensionalmente finito, entonces 
W= N(T). 

(e) Demostrar que N(Tw = ND AW y R(Tyw) = T(W). 


Demostrar la siguiente generalización del Teorema 2.7 para espacios dimen- 
sionalmente infinitos: Sean V y W espacios vectoriales y sea 8 una base 
para V. Entonces para toda función f: B— W existe únicamente una 
transformación lineal T: V — W tal que T(x) = f(x) para toda x€. 


Una función T: V — W entre los espacios vectoriales V y W se llama aditi- 
va si T(x + y) = T(x) + T(y) para toda x, y€V. Demostrar que si V 
y W son espacios vectoriales sobre el campo de los números racionales, en- 
tonces cualquier función aditiva de V en W es una transformación lineal. 


Demostrar que existe una función aditiva T: R— R (como se definió en 
el Ejercicio 26) que no es lineal. Sugerencia: Considérese a R como un 
espacio vectorial sobre el campo de los números racionales Q. Por el coro- 
lario del Teorema 1.15 este espacio vectorial tiene una base 8. Sean x y 
y elementos distintos de 8 y defínase f: 8B— R mediante f(x) = y, f(y) =x 
y f(z) =z en cualquier otro caso. Por el Ejercicio 26 existe una trans- 
formación lineal T: R->R donde R se considera como un espacio vectorial 
sobre Q tal que T(z) = f(z) para toda z € 8. Entonces T es aditiva pero 
para c = y/x, T(cx) 4 cT(x). 


REPRESENTACION MATRICIAL DE UNA 
TRANSFORMACION LINEAL 


Hasta ahora hemos estudiado las transformaciones lineales examinando sus 
rangos y sus espacios nulos. Ahora entraremos a uno de los procedimien- 
tos de mayor utilidad en el análisis de una transformación lineal sobre 
un espacio vectorial dimensionalmente finito; la representación de una 
transformación lineal mediante una matriz. De hecho, desarrollare- 
mos una correspondencia uno-a-uno entre matrices y transformaciones que 
nos permitirá utilizar las propiedades de una para estudiar las propiedades 
de la otra. 
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Necesitaremos primeramente del concepto de una “base ordenada” 
para un espacio vectorial. 


Definición. Sea V un espacio vectorial dimensionalmente finito. Una base orde- 
nada para V es una base para V establecida con un orden específico; es 
decir, una base ordenada para V es una secuencia finita de elementos de V 
linealmente independientes que generen a V. 


Ejemplo 15. Sea V tal que tenga a 8 = ([x,, X2, X4} como una base orde- 
nada. Entonces y = (x., x,, X4} es también una base ordenada, pero como 
bases ordenadas, 8 Æ 7. 


Para el espacio vectorial F", llamaremos a (e,, €», ... , en) la base 
ordenada estándar para F". 

Ahora que contamos con el concepto de base ordenada, seremos capa- 
ces de identificar vectores abstractos en un espacio vectorial de n dimen- 
siones con elementos n-dimensionales. Esta identificación será proporcio- 
nada mediante el uso de “vectores coordenados” tal como se introducen 
a continuación. 


Definición. Sea B = {Xı, ... , Xn} una base ordenada para un espacio vecto- 
rial V dimensionalmente finito. Para x€V definimos al vector coorde- 
nado de x relativo a 8, denotado por [x]p, mediante 


ay 
[x] p= "p 
a, 
donde 
n 
x=>Yajx; 


Nótese que en la definición anterior [x;]g = e;. Se deja como ejercicio 
demostrar que la correspondencia x -> [x]g nos proporciona una transfor- 
mación lineal de V en F”. Estudiaremos esta transformación con más deta- 
lle en la Sección 2.4. 


Ejemplo 16. Sean V =P¿(R) y 8 = (1, x, xX}. Si f(x) = 4 + 6x — Tæ, 
entonces 
4 
[f]; a 6]. 
—7 


Procedamos ahora con la representación matricial prometida de una 
transformación lineal. Supóngase que V y W son espacios vectoriales di- 


Representación matricial de una transformación lineal 77 


mensionalmente finitos con bases ordenadas B = [X,, ... , Xn} y y = (yr, 
- > Ym}, respectivamente. Sea T: W-— W lineal. Entonces existen esca- 
lares únicos a;¿€F(i¡=1,...,myj=1,...,n) tales que 


T(xj) = Y ay; para 1<j<n. 


i=1 


Definición. Utilizando la notación anterior, llamaremos a la matriz A de 
m x n, definida mediante A;; = aij, la matriz que representa a T en las 
bases ordenadas 8 y y y la escribiremos A = [T];. Si V = W y B = y, es- 
cribiremos A = [T]g. | 


Nótese que la j-ésima columna de A es sencillamente [T(x;)]y. Obsér- 
vese igualmente que del corolario del Teorema 2.7 se concluye que si 
U: VW—>W es una transformación lineal tal que [U]; = [T], entonces 
U=T. 

Mustraremos el cálculo de [T]; en los siguientes ejemplos. 


Ejemplo 17. Defínase 
T: P.(R) >P.,(R) mediante T(f) = f. 


Sean 8 = {1, x, x, x3) y y = (1, x, x°} bases ordenadas para P,(R) y 
P¿(R), respectivamente. Entonces 

T(1) =0:1+0:x+0:x? 

T(x) =1:1 +0:*x +0: x 

14) = 01 EZ O 

TA OLA 
Y así se tendrá 


Nótese que los coeficientes de T(x*) cuando se escriben como una combi- 
nación de elementos de y dan los elementos de la columna ¿-ésima. 
Ejemplo 18. Defínase 

T: R2>R3 mediante T(a,, a,) = (a, + 3a,, 0, 2a, — 4a;). 


Sean 8 y y las bases ordenadas estándar para R? y R*, respectivamente 
Ahora bien, 


T(1,0) = (1,0, 2) = le, + 0e, + 2e; 


T(O, 1) = (3, O, —4) = 3e, + Oe: ar 4e. 
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Por lo tanto, matricialmente, 


l 3 
mh=ļ0 ol. 
Did 
Si hacemos y'= (ez, €», e,), entonces 
—4 
[mz =|0 0]. 
1 3 


Ahora que hemos definido un procedimiento para asociar matrices con 
transformaciones lineales, veremos brevemente que esta asociación “con- 
serva” la adición. Para hacer más explícita esta situación, requeriremos de 
alguna discusión preliminar sobre la adición de transformaciones lineales. 


Definición. Sean T, U: V—>W funciones arbitrarias, donde V y W son espa- 
cios vectoriales, y sea a €F. Definimos T + U: V—> W mediante (T + U) 
(1) = T(x) + U(x) para toda xEV y al: V=>W mediante (aT)(x) = 
aT(x) para toda x €V. 


Por supuesto, esta es la definición usual de la suma y de la multiplicación 
por escalares para las funciones. Afortunadamente, sin embargo, tenemos 
el resultado de que la suma de transformaciones lineales es lineal. 


Teorema 2.8. Sean V y W espacios vectoriales y sean T. U: V—W lineales. 
Entonces para toda a €F 


(a) aT +U es lineal. 

(b) Utilizando las operaciones de suma y de multiplicación por 
escalares, como se definieron anteriormente, la colección de to- 
das las transformaciones lineales de V en W, denotada por 
£(V, W), es un espacio vectorial sobre F. 


DEMOSTRACIÓN. 


(a) Sean x, yEV y cEF. Entonces 

(aT + U)(cx + y) = aTí[cx + y) + U(cx + y) 
alcT(x) + T(y)] + cU(x) + U(y) 
= acT(x) + cU(x) + aT(y) + U(y) 
= claT + Ul(x) ¡+ [aT + Ul(y). 


ll 


Y tenemos que aT + U es lineal. 
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(b) Observando que Te, la transformación cero, juega el papel del 
elemento cero en £(V, W), es fácil demostrar que £(V, W) es 
un espacio vectorial sobre F. MW 


En el caso donde V = W escribiremos £(V) en vez de £(V, V). 

En la sección siguiente veremos una identificación completa de £(V, 
W) con el espacio vectorial Mmxn(F), donde n y m son las dimensiones 
de V y W, respectivamente. Esta identificación se establece fácilmente utili- 
zando el teorema siguiente. 


Teorema 2.9. Sean V y W espacios vectoriales dimensionalmente finitos con 
bases ordenadas $ y y, respectivamente, y sean T, U: VW => W transforma- 
ciones lineales. Entonces 


(a) [T+ U], = [TP + [UT. 
(b) [aT]; = a[TI, para toda a€F. 


DEMOSTRACIÓN. Sea B =([X,,..., 


Xn) -> Ym}. Existen es- 
calares únicos a;; y b;; en F(1 <i< m, 


yyī O 
1<j<n n) tales que 


Tx) = Dayi y Ux) = Y biyi para 1 <j<mn. 
i=1 


i=1 


Por lo tanto 


(T + U) (x;) =} (ai; + bi;)yi. 
Y entonces 
(T + Uo 5 di = (T + UR) 
Así queda demostrado (a) y la demostración de (b) es semejante. MW 


Ejemplo 19. Defínase 


T: R R’ mediante T(a,, a») = (a, + 3a», 0, 2a,, — 4a.) 


U: R?— R? mediante U(a,, a) = (a, — a,, 2a,, 3a, + 2a). 


Sean f£ y y, respectivamente, bases ordenadas estándar de R? y R?. En- 
tonces 


1 
rr =fo o0], 
2 —4 
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(tal como se calculó en el Ejemplo 18) y 


1 =l 
[Ug =|2 ol. 
3 2 


Si calculamos ahora T + U utilizando las definiciones anteriores, obte- 
nemos 


(T + U) (a, a») = (2a + 2a», 2a, Sa, al 242). 


Entonces 


que es sencillamente [T]; + [UJ;, lo que verifica al Teorema 2.9. 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Para lo 
siguiente, V y W serán espacios vectoriales dimensionalmente finitos con 
bases ordenadas 8 y y, respectivamente. Suponer que T, U: V-—>W son 
lineales. 


(a) Para cualquier escalar a, aT + U es una transformación lineal de 
V en W. 

(b) E]; = [U]; implica que T = U. 

(c) Si m= dim(V) y n= dim(W), entonces [T]; es una matriz de 
mx n. 

(d) [T+ U} = [TJ + [UJ.. 

(e) £(V, W) es un espacio vectorial. 

(1) L(V, W) = L(W, V). 


Sean 8 y y las bases ordenadas estándar para R" y R™, respectivamente. 
Para las siguientes transformaciones T: R" — R", calcular [T]. 


(a) T: R?— R? definida mediante T(a,, a,) = (2a, — az, 3a, + 4a,, a,). 
(b) T: Rè?— R? definida mediante T(a,, a, a,) = (2a, + 3a: — aa, 

a; + ax). 
(c) T: R*=R definida mediante T(a,, a2, a3) = 2a, + a. — 3as. 


Sea T: R?— R? definida como T(a,, a2) = (a, — a, a,, 2a, + az). Sea B 
la base ordenada estándar para R? y y = {(1, 1, 0), (0, 1, 1), (2, 2, 3)). 
Calcular [T]. Si «= ((1, 2), (2, 3)), calcular Tk. 


4. 


7.* 
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Defínase 


T: Maa(R)>P(R) mediante T ( a) = (a + b) + (2d)x + b. 


ea 
LEIC DE Dh rrean 


Calcular [T]; . 


S 


Para los siguientes incisos, sean 


sdo a (00) (0) 


8 = {1, x, xE, 


= (1). 
(a) Definida T: M:x:(F) > M:x:(F) mediante T(4) = A*, calcular [T]a. 
(b) Definida 


f'(0) ma) 


T: Pa(R)—>M:(R) mediante uoe Aa 


donde ’ significa diferenciación, calcular [T]. 
(c) Definida T: Mzx:(F)—>F mediante T(4) = tr(4), calcular [TF . 
(d) Definida T: P.(R)— R mediante T(f) = f(2), calcular [T - 


(e) Si 
_ (1 -2 
a=(0 a) 
calcular [4]. 


(DO)  Sif(x) = 3 — 6x + x?, calcular [f]g. 
(g) Si a€F, calcular [a]. 


Demostrar el inciso (b) del Teorema 2.9. 


Sea V un espacio vectorial n-dimensional con una base ordenada 8. Defi- 
niendo a T: V— F" mediante T(x) = [x]g, demostrar que T es lineal. 


Sea V el espacio vectorial de los números complejos sobre el campo R. Si 
T: V— V queda definida mediante T(z) = z donde Z es el complejo con- 
jugado de z, demostrar que T es lineal y calcular [T]g, donde 8 = {1, i}. 
Mostrar que T no es lineal si V se considera como un espacio vectorial 
sobre el campo C. 
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10. 


11. 


13. 


14. 


2.3 
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Sea V un espacio vectorial con la base ordenada 8 = (x,,..., x,). Defí- 
nase a x, = 0. De acuerdo con el Teorema 2.7 debe existir una transforma- 
ción lineal T: V — V definida mediante T(x;) = x; + xj; paraj=1,..., 
n. Calcular [T]g. 


Sea V un espacio vectorial n-dimensional y sea T: V — V una transforma- 
ción lineal. Supóngase que W es un subespacio T-invariante de V (ver el 
Ejercicio 24 de la Sección 2.1) de dimensión k. Demostrar que existe una 
base 8 para V tal que [T] tiene la forma 


A B 
O C 
donde A es una matriz de k x k y O es una matriz cero de (n — k) x k. 


Sea V un espacio vectorial de dimensión finita y sea T una proyección sobre 


un subespacio de V. Escoger una base ordenada adecuada 8 para V 
tal que [T]¿ sea una matriz diagonal. 


Sean V y W espacios vectoriales y sean T y U transformaciones lineales no 
nulas de V en W. Si R(T) N R(U) = (0), demostrar que (T, U} es un sub- 
conjunto de £(V, W) linealmente independiente. 


Sea V = P(R), y para j > O defínase a T;: V— V mediante T;(f) =f%>, 
donde f° sea la j-ésima derivada de f. Para cualquier entero positivo n, 
demostrar que (T,, T.,... , T,) es un subconjunto de £(V) linealmente 
independiente. 


Sean V y W espacios vectoriales y sea S subconjunto de V. Defínase S'"'= 
(TEL(V, W): T(x) = 0 para toda x€ S). Demostrar 


(a)  S" es un subespacio de £(V, W). 
(b) Si S, y S} son subconjuntos de V y $, C S», entonces $°? C S. 
(c) SiV, y V. son subespacios de V, entonces (V, + V,)” = ve Nn Vve. 


Sean V y W espacios vectoriales dimensionalmente finitos y sea T: V — W 
lineal. Supóngase que dim(V) = dim(W). Encontrar bases ordenadas £8 
y y para V y W, respectivamente, tales que [T], sea una matriz diagonal. 


COMPOSICION DE TRANSFORMACIONES LINEALES 
Y MULTIPLICACION DE MATRICES 


En la Sección 2.2 aprendimos cómo asociar una matriz con un transfor- 
mación lineal de tal modo que las sumas de matrices quedaban asociadas 
con las correspondientes sumas de transformaciones. Ahora surge la pre- 
gunta sobre cómo se relaciona la representación matricial de una compo- 
sición de transformaciones lineales con las representaciones matriciales de 
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cada una de las transformaciones lineales asociadas. El intento de res- 
ponder a esta interrogante nos conducirá a una definición de multiplicación 
de matrices. Utilizaremos la notación UT para la composición de las trans- 
formaciones lineales U y T, contrastando con g o f para funciones arbitrarias 
g y f. Específicamente, tenemos la definición siguiente. 


Definición. Sean V, W y Z espacios vectoriales y sean T: VW>WyU: WeZ 
lineales. Definamos UT: V — Z mediante (UT)(x) = U(T(x)) para toda 
x€v. 


Nuestro primer resultado muestra que la composición de transforma- 


ciones lineales es lineal. 


Teorema 2.10. Sean V, W y Z espacios vectoriales y T: V>W yU: W>Z 
lineales. Entonces UT: V> Z es lineal. 
DEMOSTRACIÓN. Sean x, yEV y a€F. Entonces 
UT(ax + y) = UQT (ax + y)) = U(aT(x) + T(y)) 
aU(T(x)) + U(T(y)) = a(UT)(x) + UT(y). E 


El siguiente teorema enuncia algunas de las propiedades de la compo- 
sición de transformaciones lineales. 


Teorema 2.11. Sea V un espacio vectorial. Sean T, U,, U EL(V). Entonces 


(a) T(U, + U,) = TU, + TU, y (U, + U,)T = UT + UT. 
(b) T(UU,) = (TU,)U.. 

(c) Tl=IT=7T,. 

(d) a(U,U.) = (aU,)(U. = U,(aU.) para toda a €F. 


DEMOSTRACIÓN. Ejercicio. 


Estamos ahora en posición de definir el producto AB de dos matrices 
A y B. Por el Teorema 2.9, parece razonable requerir por analogía que 
si A = [U]; y B = [Tf, donde T: V—W y U: W >Z, entonces AB = 
[UTE. 

Ahora sean T, U, A y B como anteriormente y sean a = {X -s Xu), 
B=b,..., Ym} Y y = {Zn -.. > Zp} bases ordenadas para V, W y Z, 
respectivamente. Para 1 < j < n tendremos 


m 


UDE) = UTE) = U (E Buy) = È Buo 
k-i k-1 
m P p m 
= X By È Anzi) = Y (3 4181) Zi 
k 1 i 1l Cai kol 


p 
= 5 CijZis 


EET 
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donde 


m 
Ci; = DA mBs;. 
k=1 
Este cálculo sugiere la siguiente definición de multiplicación de ma- 
trices. 


Definición. Sean A una matriz de m x n y B una matriz de n x p. Definimos 
el producto de A por B, denotado por AB, como la matriz de m x p tal 
que 

n 
(AB); = 2 AB;  paral<i<m, 1<j<p. 
k=1 
Nótese que (AB);; es la suma de los productos de los elementos co- 
rrespondientes al ¡-ésimo renglón de A y a la j-ésima columna de B. 
Al final de esta sección el lector verá algunas aplicaciones interesan- 
tes de esta definición. | 
El lector debe observar que para que el producto AB quede definido, 
existen restricciones en cuanto a las dimensiones relativas de A y B. El 
siguiente dispositivo simbólico puede ser útil: “(m x n): (nx p) = 
(m x p)”; esto es, para que el producto AB esté definido, las dos dimen- 
siones “interiores” deben ser iguales y las dos dimensiones “exteriores” 
dan el tamaño del producto. 


Ejemplo 20. 


deaa e) 


Nótese de nuevo la relación simbólica (2 x 3):(3x1)=2x 1. 


Como en el caso de la composición de funciones, tenemos que el pro- 
ducto de matrices no es conmutativo. Considérese los dos productos si- 


guientes. 

1 2/0 3y _ /2 7 e o E 

O 1A1 2) 11 2 1 2/0 1) M 4)' 
Donde vemos que aun cuando ambos productos matriciales AB y BA están 
definidos, no es necesariamente cierto que AB = BA. 

Recordando la definición de transpuesta de una matriz dada en la 

Sección 1.3, demostraremos que si A es una matriz de m x n y B es una 
matriz de n x p, entonces (AB)! = B'Af. Como 


(AB);, = (AB); = Y A;irBri 


k=1 
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(BAD), = > BOCA) e; =D Bri jk, 
k=1 k=1 


ya queda demostrado. Por lo tanto, la transpuesta de un producto es igual 
al producto de las transpuestas, cambiando el orden de las matrices que 
se multiplican. 


El teorema siguiente es una consecuencia inmediata de nuestra defini- 
ción del producto de matrices. 


Teorema 2.12. Sean V, W y Z espacios vectoriales dimensionalmente finitos con 
bases ordenadas a, B y y, respectivamente. Sean T: V>W y U: W>Z 
transformaciones lineales. Entonces 


[UT]; = [URAT]$. 
Corolario. Sea V un espacio vectorial dimensionalmente finito con una base 
ordenada B. Sean T, UEL(V). Entonces [UT]; = [UJg[T]g. 
Ilustraremos lo anterior con el siguiente ejemplo. 
Ejemplo 21. Defínase 
U: P,(R) =>P.(R) mediante U(f) =f' 
como en el Ejemplo 17. Defínase 


VOR malane TO= wa 


Sean a = (1, x, x’, x%) y 8 = {1, x, x?). Se tiene claramente que UT = |. 
Para ilustrar el Teorema 2.12, obsérvese que 


00 0 
010A oo 100 
A o li 
0.0.0 3 0 0 1 
0.04 


La matriz diagonal de 3 x 3 anterior se llama “matriz identidad” y 
se define a continuación junto con una notación de gran utilidad, la “delta 
de Kronecker”. 


Definiciones. Definimos la delta de Kronecker 3; mediante di =1sii=j]y 
ii = 0 si ij, y la matriz identidad de n x n, I,, mediante (L)ij = ôi; 


Así 


1 0 0 
L=(D, h= lo a OO ON 
O O 1 
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Veremos en el teorema siguiente que la matriz identidad actúa como 
un elemento unitario en Ma..(F). Cuando el contexto sea lo suficiente- 
mente claro, omitiremos algunas veces el subíndice m de /.. 


Teorema 2.13. Para cualquier matriz A de n x n tenemos que LA = Al, = A, 
además, si V es un espacio vectorial dimensionalmente finito de dimensión 
n con una base ordenada f, entonces [ly]g = bn. 


DEMOSTRACIÓN. 
MA) = X UN iAxj = Y 8inAxj = Ai: 
k=1 k=1 


Por lo tanto, 1,4 = A. De la misma manera Aln =| A. Sea B= AX.» 
Xn}. Entonces, para cada j tenemos 


m 


ly(x;) SAE 2 S¡¡Xi. 


=1 
Por lo tanto [Iy] = In MW 
Para cualquier matriz A de n x n definiremos A? = AA, A’ = A'A, 


y en general A* = AMA para k= 2, 3,... Definiremos 4’ = Ín. 
Con esta notación vemos que si 


_f0 0 
a=(1 0) 
entonces A? = O (la matriz nula) aun cuando A + O, y vemos que la 
propiedad de eliminación (cancelación) para campos no es válida para 


las matrices. El siguiente teorema muestra, sin embargo, que la multipli- 
cación de matrices es distributiva respecto a la suma. 


Teorema 2.14. Sea A una matriz de m x n y sean B y C matrices de n x p. 
Entonces 
A(B +C) = AB + AC, 


y para cualquier escalar a 
a(AB) = (aA)B = A(aB). 
DEMOSTRACIÓN. 


[A(B + 01 = AB +C) = Y An(Buy + Cu) 


k=1 k=1 


= Y (ABr + AC) = B AirBr Y Y AnCr; 
k.1 


k=1 k=-1 
= (AB); + (AC) ¡¡ = [AB + ACT] is. 


El resto de la demostración se deja como ejercicio. Mi 
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Corolario. Sea A una matriz de m x n, y sean B,, ... , B, matrices de n xp 
Y ai... , ax EF. Entonces 


A (Zas) = Y a,AB.. 


1=1 


DEMOSTRACIÓN. Ejercicio. 


Si A es una matriz de m x n, escribiremos a veces A = (At anaa A”) 
donde 4/ es la columna j-ésima 


, 


Ami 
de la matriz A. 


Para el teorema siguiente, e; representa la j-ésima columna de ly: 


Teorema 2.15. Sea A una matriz de m xn y B una matriz de n x p. En- 


tonces 
(a) (AB)i = ABI. 
(b) Bi = Bej. 
DEMOSTRACIÓN. 
(4B);; È AikBky B,, 
(ABY=| - a = A| - |= AB. 
AB); È AmkBky Bp; 


Por lo tanto, (a) queda demostrado. La demostración de (b) se deja 
como ejercicio. W 


El resultado siguiente justificará mucho de nuestro trabajo anterior; 
utilizará la representación matricial de una transformación lineal y el 


producto de matrices para evaluar la transformación en cualquier vector 
dado. 


Teorema 2.16. Sean V y W espacios vectoriales dimensionalmente finitos que 
tienen bases ordenadas fB y y, respectivamente, y sea T: V—>W una trans- 
formación lineal. Entonces, para toda x € V tenemos 


[169], = TREs. 


88 


Transformaciones lineales y matrices 


DEMOSTRACIÓN. Sea B= (X,, ... , Xn} y sea A = [TI, . Como 


1(Sax)| = [Saro] = Satoh 


por el Ejercicio 7 de la Sección 2.2, según el corolario del Teorema 2.14 
es suficiente demostrar el teorema para x = x;(1 <j < n). Pero esto se 
sigue de la definición de A y del Teorema 2.15 puesto que 


[T(x1)], = A} = Ae; = Alx;lp = [Tx]. 


Ejemplo 22. Sea T: P.(R)-—=>P.(R) definida mediante T(f) = f', y sean 
B= {1, x, x°, x*} y y= (1, x, x?) bases ordenadas para P2(R) y P.(R), 
respectivamente. Si A = [T]; entonces tenemos del Ejemplo 17 que 
01.00 
A=|0 0 2 Ol. 
0003 
llustraremos el Teorema 2.16 verificando que [T(p)], = [TI;[p]g don- 
de pEP,(R) es el polinomio p(x) = 2 — 4x + x? + 3x. Sea q = T(p); 
entonces q(x) = p'(x) = —4 + 2x + 9x. Por lo tanto 
—4 


To), = l4], = 


Pero también 


2 
010 j, —4 
mip = Atel, =0 0 2 0 ¿| =| 2]. 
0003, 9 


Completaremos esta sección con la introducción de la “transformación 
de multiplicación por la izquierda” L,, donde A es una matriz de m x n. 
Esta transformación es probablemente la herramienta más importante para 
transferir propiedades sobre transformaciones a propiedades semejantes 
sobre matrices y viceversa. Por ejemplo, la utilizaremos para demostrar 
que el producto de matrices es asociativo. 


Definición. Sea A una matriz de m x n con elementos de un campo F. Deno- 


tamos por L, al mapeo La: F" => F™ definido por L,(x) = Ax (el produc- 
to matricial de A por x) para cada vector columna x €F". Llamamos a L, 
una transformación de multiplicación por la izquierda. 
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Ejemplo 23. Sea 
(121 
26-10) 
Si 
1 
x= 31), 
=1 
entonces 


l 
1 2 1\ 6 
LD =4x =(, ¡ a i al) 


Veremos en el teorema que sigue que L, no únicamente es lineal, sino, 
de hecho, tiene otras muchas propiedades de gran utilidad. Estas propie- 
dades son todas muy naturales y por lo tanto son fáciles de recordar. 


Teorema 2.17. 
transformación La: 


Sea A una matriz de m x n con elementos de F. Entonces la 
Fa Fm es lineal. Además, si B es cualquiera otra 


matriz de m x n (con elementos de F), tenemos las siguientes propie- 


dades. 
(a) [La]; = A, donde B y y son las bases ordenadas estándar para 
Fu y F”, respectivamente. 
(b) La = Lg si y sólo si A = B. 
(c) Lams = La + Lg y laa = ala para toda a €F. 
(d) SiT: Fn—>F" es lineal, entonces existe una matriz única C de 
m x n tal que T = lẹ. 
(e) Si E es una matriz de n.x p, entonces Las = Lale. 
(£) Si m= n, entonces li, = Ip”. 
DEMOSTRACIÓN. El hecho de que L, sea lineal se deriva directamente del 


Teorema 2.14 y su corolario. 


(a) 


(b) 


La columna j¡-ésima de [L,], es igual a L,(e;). Pero Lale) = 
Ae; = Ai, y entonces [L4]; = A. 

Si L, = L, entonces podemos utilizar (a) para escribir A = [La], 
= [Ll]; = B. Por lo tanto A = B. La prueba de la proposición 
recíproca es trivial. 


La demostración de (c) le corresponde al lector. 


(d) 


Sea C = [T]. En virtud del Teorema 2.16 tenemos que [T (x) ]y = 
[T [x]g, o bien T(x) = Cx = Le(x) para toda x. Entonces T = Le. 
La unicidad de C se deduce de (b). 
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(e) Para cualquier j tenemos Lag(e;) = (AE )e; = (AE)' = AE! = 
A(Ee;) = L (Ee;) = La(Lr(ej)) = (Laily) (e,). De donde Lis = 
LaL; por el Teorema 2.7. 


La demostración de (f) le corresponde al lector. MW 


Utilizaremos este tipo de transformaciones para establecer una impor- 
tante propiedad sobre matrices. / 


Teorema 2.18. Sean A, B y C matrices tales que A(BC) está definido. Enton- 


ces (AB)C queda definido y A(BC) = (AB)C; esto significa que el pro- 
ducto de matrices es asociativo. 


DEMOSTRACIÓN. Se deja al lector demostrar que (AB)C está definido. 
Utilizando el inciso (e) del Teorema 2.17 y la asociatividad de una compo- 
sición de funciones, tenemos 


Laso) =E LaLsc => Lal glo) = (LaLa)Le al LisLe = Liumc- 
Así, del inciso (b) del Teorema 2.17 tenemos A(BC) = (AB)C. E 


Es innecesario decir que este teorema podría demostrarse directamente 
a partir de la definición del producto matricial. La demostración anterior, 
sin embargo, proporciona un prototipo de muchos otros argumentos que 
utilizan las relaciones entre transformaciones lineales y matrices. 


Una aplicación 


Una grande y variada colección de aplicaciones interesantes surge en rela- 
ción con unas matrices especiales llamadas “matrices incidentes”. Una 
matriz incidente es una matriz cuadrada en donde todos los elementos 
son ceros o unos y, por conveniencia, todos los elementos de la diagonal 
principal son cero. Si tenemos una cierta relación entre un grupo de n 
objetos que denotaremos por 1, 2,... , n, entonces definimos la matriz 
de incidencia asociada A mediante: A;; = l si i está relacionado con j 
y Ai; = 0 en cualquier otro caso. 

Para hacer las cosas concretas, supongamos que tenemos cuatro per- 
sonas, cada una de las cuales posee un dispositivo de comunicación. Si la 
relación entre este grupo es “puede transmitir a”, entonces A4;;=1 si i 
puede mandar un mensaje a j y A;; = 0 en cualquier otro caso. Supón- 
gase que 


=- O = O 
=- = O = 
O o o © 
or-o 
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Entonces como As, = l y Ass = O vemos que la persona 3 puede trans- 
mitir a 4 pero 1 no puede transmitir a 4. 

Obtendremos una interpretación interesante de los elementos de A?. 
Considérese por ejemplo, / 


(AD = Anc + AnA t AzA F AnuAa. 


Nótese que cualquiera de los términos A:x4r, será igual a 1 si y sólo si 
Ass y A son iguales a 1 esto es, si y sólo si 3 puede transmitir a k y k 
puede transmitir a 1. Así (4*),, da el número de maneras en las que 
3 puede transmitir a 1 en dos etapas (o en un relevo). Como 


1001 
pj 200 
2101F 
1 1 0 1ł 


vemos que 3 puede transmitir a 1 de dos maneras con un relevo. En ge- 
neral (A + A? + ... + A");; es el número de maneras en las que i 
puede transmitir a j en un máximo de n etapas. 

Una colección máxima de tres o más personas con la propiedad de que 
cualquier par de ellas transmita recíprocamente de una a otra se llama 
una cliqué. El problema de la determinación de las cliqués parece a prime- 
ra vista demasiado difícil. Sin embargo, si se define una nueva matriz B 
por B;; = 1 si į y j pueden transmitirse de una a otra y de lo contrario 
Bi; = 0, entonces puede mostrarse (ver Ejercicio 16) que la persona i 
pertenece a una cliqué si y sólo si (B*);;> 0. Por ejemplo, supóngase 
que la matriz de incidencia asociada con alguna relación es 


0 


o 1 
1 1.0 
A = ; 
1 o 1 
l 1 0 
Para determinar qué personas pertenecen a las cliqués, formamos una ma- 
triz B como la anterior y calculamos B*. En este caso 


0101 0404 
0 4040 

p| LO! y B= 
0101 0404 
1010 4040 


Como todos los elementos de la diagonal de B* son ceros, concluimos 
que no hay cliqués en esta relación. 

Nuestro ejemplo final acerca del uso de matrices de incidencia se rela- 
ciona con el concepto de dominancia. Una relación entre un grupo de 
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personas se llama relación de dominancia si la matriz de incidencia aso- 
ciada A tiene la propiedad de que 4;;= 1 si y sólo si Aj; = O para 
toda į y toda j, esto es, dadas dos personas cualesquiera, exactamente 
una de ellas domina (o, utilizando la terminología de nuestro primer ejem- 
plo, puede transmitir un mensaje) a la otra. Para tal relación, puede 
demostrarse (ver Ejercicio 18) que la matriz A + A? tiene un renglón 
(columna) que contiene elementos positivos en todas las posiciones excepto 
en la diagonal principal. En otras palabras, existe al menos una persona 
que domina a (es dominada por) todas las demás en una o dos etapas. 
De hecho, puede demostrarse que cualquier persona que domina a (es 
dominada por) el mayor número de personas en la primera etapa cumple 
con esta propiedad. Considérese, por ejemplo, a la matriz 


0 
0 
01. 
1 
0.0 


El lector deberá verificar que esta matriz corresponde a una relación de 
dominancia. Ahora bien, 


<= = O O = 
== >O O - © 
O- O =e 


N NNONWN 
N Nor 
DO Nne = 
O- ro 


2 


Entonces, las personas 1, 3, 4 y 5 dominan a (pueden mandar mensa- 
jes a) todas las demás en a lo más dos etapas, mientras que las personas 
1, 2, 3 y 4 son dominadas por (pueden recibir mensajes de) todas las 
demás en a lo más dos etapas. 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Para lo que 
sigue, V, W y Z son espacios vectoriales con bases ordenadas (finitas) 


a, B y y, respectivamente; T: W>W y U: W->Z son ambas lineales; 


y A y B son matrices 

(a) [UTR = UTE. 

(b) {[T(x)]s = [T]f[x]e para toda x €V. 
(c) [U(y)]s = [UJ'y]g para toda y EW. 
(d) [ly]e =]. 

(e) [TF] = (0D. 


N œ 
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(f) A? = 1 implica que A = l o bien A = --], 

(g) T= L, para alguna matriz 4. \ 

(h) A? = O implica que A = O donde\O denota la matriz nula. 
(1) Lin = Li + Ly. 

(j) Si A es cuadrada y A;¡;¡= 8;; para toda i y j, entonces 4 = 1. 


0 A E 
4 = () 1) B=(4 N 
2 

apoE aA EA 
c=(_, 2) ol y o=( 3] 


Calcular A (2B + 3C), (AB)D y A(BD). 


Sean 


Sea g(x) = 3 + x. Defínase 
T: P(R)—>P.(R) para T(f) = fg + 2f. 


U: P.(R)=>R3 para U(a + bx + cx) = (a + b, c, a— b). 
Sean 8 = {1, x, x?) y y = {8, €z es). 


(a) Calcular directamente [UT;, [T]s y [UT];. Luego, utilizar el Teorema 
2.12 para verificar el resultado. 

(b) Sea h(x) = 3 — 2x + x?. Calcular [A] y [U(A)],. Luego, emplear 
[U]; de (a) y utilizar el Teorema 2.16 para verificar el resultado. 


Para cada uno de los incisos siguientes, sea T la transformación lineal defi- 
nida en el inciso correspondiente del Ejercicio 5 de la Sección 2.2. Utilizar 
el Teorema 2.16 para calcular: 


1 
(b) [T(f)la, donde f(x) = 4 — 6x t 3x?. 
(c) [T(4)],, donde A = E | al 
(d) [T(f)],, donde f(x) = 6 — x + 2x. 


(a) [T(4)]a donde A = E e) 


Completar la demostración del Teorema 2.14 y su corolario. 
Demostrar el inciso (b) del Teorema 2.15. 
Demostrar el Teorema 2.11. 


Encontrar transformaciones lineales U, T: F?>F? tales que UT = Te (la 
transformación nula) pero TU 4 To. Utilice su respuesta para encontrar ma- 
trices A y B tales que AB = O pero BA 40. 
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9. 


10. 


11. 


12. 


13. 


14.* 


15. 


16. 


17. 
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Sea A una matriz de m x n. Demostrar que A es una matriz, diagonal si 
y sólo si A¡;= 8;¡A;¡; para toda i y toda j. 


Sea V un espacio vectorial y sea T: V— V lineal. Demostrar que T? = To 
si y sólo si R(T) C N(T). 


Sean V, W y Z espacios vectoriales, y sean T: VW=>W y U: W >Z li- 
neales. 


(a) Si UT es uno-a-uno, demostrar que T es uno-a-uno. ¿También U debe 
ser uno-a-uno? 

(b) Si UT es sobreyectiva, demostrar que U también lo es. ¿También T 
debe ser sobreyectiva? 

(c) Si U y T son uno-a-uno y sobreyectivas demostrar que UT también 
lo es. 


Sean A y B matrices de n x n. Recordar que la traza de A, denotada por 
tr(A), es igual a 


SA, 
Demostrar que tr(4B) =tr(BA) y tr(4) = tr(4!). 


Sea V un espacio vectorial dimensionalmente finito y sea T: V > V lineal. 


(a) Si rango(T) = rango(P), demostrar que R(T) N N(T) = (0). De- 
ducir que V = R(T) BANCT). 
(b) Demostrar que existe un entero positivo k tal que V = R(T*) @ N(T*). 


Sea V un espacio vectorial. Determinar todas las transformaciones lineales 
T: V>V tales que T= T’. Sugerencia: Nótese que x= T(x) + (x — 
T(x)) para toda x en V y demostrar que V = (y: T(y) = y} @®N(T). 


Utilizando únicamente la definición de multiplicación matricial, demostrar 
que la multiplicación de matrices es asociativa. 


Para una matriz de incidencia A con la matriz asociada B definida por: 
Bi; = 1, si i está relacionada con j y j está relacionada con i, y de lo con- 
trario B;¡; = 0, demostrar que i pertenece a una cliqué si y sólo si (B*);; > 0. 


Utilizar el Ejercicio 16 para determinar las cliqués en las relaciones corres- 
pondientes a las siguientes matrices de incidencia. 


0.1.0 1 0.0.1 1 
1000 1001 
® loro ı O tlioo1 
1010 1010 
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18. Sea A una matriz de incidencia asociada con una relación de dominancia. 
Demostrar que la matriz A + A? tiene un renglón (columna) que contiene 


elementos positivos en todas las posiciones excepto en la diagonal prin- 
cipal. 


19. Demostrar que la siguiente matriz A corresponde a una relación de domi- 
nancia y utilizar el Ejercicio 18 para determinar cuál(es) persona(s) domi- 
na(n) a (son dominadas por) las demás en no más de dos etapas. 


0 1i 0 
A=|0 0 1]. 
100 


20. Sea A una matriz de incidencia de n x n que corresponde a una relación 
de dominancia. Determinar el número de elementos no nulos de A. 


2.4 INVERTIBILIDAD E ISOMORFISMOS 


El concepto de invertibilidad se introduce muy temprano en el estudio de 
las funciones. Por fortuna, muchas de las propiedades intrínsecas de las 
funciones son compartidas por sus inversas. Por ejemplo, en cursos de 
cálculo aprendimos que las propiedades de continuidad o de diferenciabi- 
lidad generalmente se conservan para las funciones inversas. Veremos en 
esta sección (Teorema 2.19) que la inversa de una transformación lineal 
también es lineal. Este resultado nos ayudará de una manera importante 
en el estudio de las “inversas” de las matrices. Como era de esperarse de 
la Sección 2.3, la inversa de la transformación L, (cuando existe) puede 
utilizarse para determinar las propiedades de la inversa de la matriz A. 

En el resto de esta sección aplicaremos muchos de los resultados sobre 
invertibilidad al concepto de “isomorfismo”. Veremos que los espacios vec- 
toriales dimensionalmente finitos (sobre F) de dimensiones iguales pueden 
ser identificados. En breve, estas ideas serán expuestas con más precisión. 

Los conceptos sobre funciones inversas que se encuentran en el apén- 
dice B son, por supuesto, verdaderos para el caso de las transformaciones 
lineales. No obstante, repetiremos algunas de estas definiciones para em- 
plearlas en esta sección. 


Definición. Sean V y W espacios vectoriales y sea T: V => W lineal. T tiene una 
inversa U: W-—V si TU =ly y UT = ly. Como en el Apéndice B, las 
inversas son únicas y escribiremos U = T~. Decimos que T es invertible 
si T tiene una inversa. 


Las siguientes propiedades se cumplen para funciones invertibles T y U. 
1. (TU)? = Uat. 
2. (T°) = T; en particular, T-* es invertible. 
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Utilizaremos también el hecho de que una función es invertible si y sólo 
si es uno-a-uno y sobreyectiva. 


Ejemplo 24. Defínase T: P,(R)— R? mediante T(a + bx) = (a, a+ 
b). El lector podrá verificar directamente que T~: R? — P,(R) queda 
definida mediante T-*(c, d) = c + (d — c)x. Obsérvese que T+, también es 
lineal. Como lo demuestra el Teorema 2.19, esto es cierto en general. 


Teorema 2.19. Sean V y W espacios vectoriales, y sean T: vow lineales e 
invertibles, entonces T": W —> V es lineal. 


DEMOSTRACIÓN. Sean yı, Ye EW y cEF. Como T es sobreyectiva y uno- 
a-uno, existen vectores únicos x, y x, tales que T(x,) = y, y T(x») = y». 
Entonces x, = T"(y,) y x. = T? (y), y así 


T(cy, + y.) = Tiet (x) + T(x.)] = T"[T (cx, + x2)] 
= cx, t x, = c'(y.) + T° (y.). B 


El Teorema siguiente se sigue inmediatamente del Teorema 2.5. 


Teorema 2.20. Sean V y W espacios vectoriales dimensionalmente finitos de 
dimensiones iguales, y sea TEL(V, W). Entonces las siguientes proposi- 
ciones son equivalentes. 


(a) T es invertible. 
(b) T es uno-a-uno. 
(c) T es sobreyectiva. 


Estamos ahora listos para definir la inversa de una matriz. El lector 
debería darse cuenta de la analogía con la inversa de una transformación 
lineal. 


Definición. Sea A una matriz de n x n. Entonces A es invertible si existe una 
matriz B de n x n tal que AB = BA = I. 

La matriz B es única y se llama inversa de A y se escribe B = A”. 

(Si C fuera otra matriz, entonces C = CI = C(AB) = (CA)B = IB = B. 


Ejemplo 25. El lector deberá verificar que la inversa de 


5 7 T 3- 7 
2 3 e 5) 
En la Sección 3.2 aprenderemos una técnica para calcular la inversa 


de una matriz. Ahora nos gustaría desarrollar una serie de resultados que 
relacionan inversas de matrices con inversas de transformaciones lineales. 
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Tecrema 2.21. Sean V y W espacios vectoriales dimensionalmente finitos con 
bases ordenadas R y y, respectivamente. Sea T: V —=>W lineal. Entonces 
T es invertible si y sólo si [T], es invertible. Además, [Tf = (TR) 


DEMOSTRACIÓN. Supóngase que T es invertible. Como T es uno-a-uno, el 
Teorema 2.6 implica que T(8) es un subconjunto independiente de W. 
Como T es sobreyectiva, el corolario del Teorema 2.3 implica que el sub- 
espacio generado por L(T(8)) = R(T) = W. Entonces T(8) es una base 
para W con dim(V) elementos. Por lo tanto, dim(V) = dim(W). Sea 
n = dim(V). Entonces [T], es una matriz de n x n. Ahora bien, T~: 
W> V satisface TT ' = Iw y TIT = ly. De donde, 


h= [yle = [TT = 0 TT. 


Análogamente, [TPIT] = In, y por lo tanto ([T]J,)"' = T]. 
Ahora sea A = [T], invertible. Entonces existe una matriz B de 
n x n tal que AB = BA = I,. Defínase 


U: W>V mediante U(x;) = Y B;;y,, 
donde y = [X1, ..., Xa} y B= {Yo --+ + Y). Entonces [U] i= B. De- 
mostraremos que U = T°. Obsérvese que por el Teorema 2.12 [UT] = 
[UY[T], = BA = I = [Iv] Así, UT = ly, y análogamente TU = lw. E 


Ejemplo 26. Para los espacios vectoriales P,(R) y R', selecciónese las 
bases 8B = {1, x} y y= [é,, e»), respectivamente. Con la notación del 
Ejemplo 24, tenemos que 


E 0 0 PEN 1 0 
le 1) y TY e eN 


Se puede verificar mediante el producto matricial que cada matriz es la 
inversa de la otra. 


Corolario 1. Sea V un espacio vectorial dimensionalmente finito con una base 
ordenada B. y sea T: V —>V lineal. Entonces T es invertible si y sólo si 
[T]; lo es. Además, [T "jg [T),'. 


DEMOSTRACIÓN. Ejercicio. 

Corolario 2. Sea A una matriz de n x n. Entonces A es invertible si y sólo si 
L, es invertible. Además (La)? = Lio. 
DEMOSTRACIÓN. Ejercicio. 


La noción de invertibilidad se puede utilizar para formalizar lo que 
el lector ya debe haber observado, esto es, que ciertos pares de espacios 
vectoriales se parecen mucho entre sí, excepto por la forma de sus ele- 
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mentos. Por ejemplo, en el caso de M...(F) y F', si asociamos a cada 


matriz 
a b 
(i d 


la 4-dimensional (cuarteta) (a, b, c, d), vemos que las sumas y los pro- 
ductos por escalares se asocian de una manera semejante; esto es, en 
términos de la estructura de espacios vectoriales, estos dos espacios vecto- 
riales pueden considerarse idénticos o “isomorfos”. 


Definición. Sean V y W espacios vectoriales. Decimos que V es isomorfo a 
W si existe una transformación lineal T: V —>W que sea invertible. Tal 
transformación lineal se llama isomorfismo de V en W. 


Dejamos como ejercicio la demostración del hecho de que “es isomor- 
fo a” es una relación de equivalencia. 


Ejemplo 27. Defínase T: F*->P,(F) mediante T(a,, a.) = a, + a.x. Es 
evidente que T es invertible; así F* es isomorfo a P,(F). 


Ejemplo 28. Defínase 


; (40) f(2) 

T: P(R)—> M: (R) mediante T(f) ee Ol 
Se puede verificar fácilmente que T es lineal. Mediante el uso de la ecua- 
ción de interpolación de Lagrange de la Sección 1.6 puede demostrarse 
(compárese con el Ejercicio 20) que T(f) = O solamente cuando f es el 
polinomio cero. Luego, T es uno-a-uno y por el Teorema 2.20 tenemos 
que T es invertible. Podemos concluir que P,(R) es isomorfo a M2, ,(R). 
En cada uno de los dos ejemplos anteriores, el lector habrá observado 
que los espacios vectoriales isomorfos tienen dimensiones iguales. Como 

lo demuestra el teorema siguiente, esto no es ninguna coincidencia. 


Teorema 2.22. Sean V y W espacios vectoriales dimensionalmente finitos (so- 
bre el mismo campo F). Entonces V es isomorfo a W si y sólo si dim(V) 
= dim(W). 


DEMOSTRACIÓN. Supóngase que V es isomorfo a W y que T: V —W es 
una transformación lineal uno-a-uno de V en W. Entonces como en la 
demostración del Teorema 2.21 tenemos que dim(V) = dim(W). 

Ahora supóngase que dim(V) = dim(W) y sean 8 = (x,,..., Xa} y 
y + [Mi ... . yu) bases para V y W, respectivamente. Por el Teorema 2.7 
existe T: V — W tal que T es lineal y T(x;) = y; para i = l,... n. Utili- 
zando el corolario al Teorema 2.3, tenemos que R(T) = L(T(8)) = L(y) 
~ W, por lo que T es sobreyectiva. Por el Teorema 2.5 tenemos que T 
también es uno-a-uno. E 
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Corolario. Si V es un espacio vectorial de dimensión n, entonces V es isomor- 
fo a F. 


Hasta ahora hemos asociado transformaciones con sus representaciones 
matriciales. Ahora estamos en posición de demostrar que, como espacio 
vectorial, la colección de todas las transformaciones entre dos espacios vec- 
toriales dados puede ser identificada con el espacio vectorial adecuado de 
matrices de m x n. 


Teorema 2.23. Sean V y W espacios vectoriales dimensionalmente finitos de 
dimensiones n y m, respectivamente, y sean B y y bases ordenadas para 
V y W, respectivamente. Entonces la función db: L(V, W) —> Mmxa (F), 
definida por (T) = [T]; para TEL(V, W) es un isomorfismo. 


DEMOSTRACIÓN. El Teorema 2.9 nos permite concluir que «+ es lineal. 
Entonces debemos demostrar que $ es uno-a-uno y sobreyectiva. Sean 


BED Xa} y yE {Yn Ymb 


(a) Demostraremos primero que N($9) = {Te}, donde Te es la trans- 
formación cero. Esto implicará que + es uno-a-uno. Supóngase que (T) 
= O. Entonces para cada j tenemos T(x;) = Oy, + ... + Oym = 0. Por 
el corolario del Teorema 2.7 tenemos que T = To. 

(b) Ahora demostraremos que $ es sobreyectiva. Sea A una matriz 
de m x n. De acuerdo con el Teorema 2.7 existe TEL(V, W) tal que 


m 


Taj) = S Ay para 1<j<mn. 
CEE 
Entonces [T]; = 4, y por lo tanto ẹ(T) —- A, es sobreyectiva. 


Corolario. Sean V y W espacios vectoriales dimensionalmente finitos de dimen- 
siones m y n, respectivamente. Entonces L(V, W) es dimensionalmente 
finito de dimensión mn. 


DEMOSTRACIÓN. La demostración se sigue de los Teoremas 2.23 y 2.22, 
y del hecho de que dim(M,,..(F)) = mn. E 


Concluiremos esta sección con un resultado que nos permitirá ver más 
claramente la relación entre transformaciones lineales definidas en espacios 
vectoriales abstractos dimensionalmente finitos y transformaciones linea- 
les definidas en F”, 

Principiaremos citando la transformación x > [x]g discutida en la Sec- 
ción 2.2. 


Definición. Sea B una base ordenada para un espacio vectorial n-dimensional V 
sobre el campo F. La representación estándar de V con respecto a 8 
es la función $g: V — F" definida por $g(x) = [x]g para toda x EV. 
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Ejemplo 29. Sea V = R?, 8 = ((1, 0), (0, 1)}, y y = {(1, 2), (3, 4)). 
Para x = (1, —2) tenemos 


pco == (_7) y eno == (77). 


Ya hemos observado antes que pg es una transformación lineal. El teo- 
rema siguiente nos dice mucho más. 


Teorema 2.24. Para cualquier espacio vectorial V dimensionalmente finito con 
una base ordenada B, py es un isomorfismo. 


DEMOSTRACIÓN. Ejercicio. 


Este teorema nos proporciona una prueba alternativa de que un espa- 
cio vectorial n-dimensional es isomorfo a F" (ver el corolario del Teore- 
ma 2.22). ' 

Estamos ahora listos para utilizar la representación estándar de un 
espacio vectorial junto con la representación matricial de una transforma- 
ción lineal para estudiar la relación entre la transformación lineal T: 
V > W donde V y W son espacios vectoriales abstractos dimensionalmente 
finitos, y La: F"-—>F"”, donde A = [T]; y 8 y y son bases ordenadas 
cualesquiera para V y W, respectivamente. 

Antes de enunciar el Teorema 2.25 consideraremos la figura 2.2. Nóte- 
se que existen dos composiciones de transformaciones lineales que mapea- 
rán a V en F”: 


1. Mapeo de V en Fº con ¿g y continúa esta transformación con L4; 
esto nos dará la composición Ligg. 

2. Mapeo de V en W con T, y continúa por py para obtener la com- 
posición «yT. 


Estas dos composiciones están representadas por las flechas punteadas 
en el diagrama. El Teorema 2.25 establece que ambas composiciones dan 
el mismo resultado; esto es, que ambas composiciones son iguales. 


Ww 


figura 2.2 


A 
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Heurísticamente, el teorema establece que después de que V y W hayan 
sido identificados con F" y F™ a través de œg y dy, respectivamente, pode- 
mos “identificar” a T con La. 


Teorema 2.25. Sea T: V—> W una transforiiación lineal de un espacio vecto- 
rial n-dimensional V sobre F a un espacio vectorial m-dimensional W 
sobre F. Sean B y y bases ordenadas, respectivamente, para N y W, y sea 
A =[TI,. Entonces Lag = pyl. 


DEMOSTRACIÓN. El teorema es esencialmente una reformulación del Teo- 
rema 2.16, porque si x €V, entonces 


(Lagg) (x) = Lu(óg(0)) = La(lxlg) = Aix] = UI, ble 
= [T1(0) = (0160) = (47060). El 
Ejemplo 30. Recordemos la transformación T: P,(R) => P¿(R) definida 
en el Ejemplo 17. (T(f) =f'.) Sean 8 = {1, x, x°, x°} y y = {1, x, x°} 
bases ordenadas para P,(R) y P.(R), respectivamente, y sean pg: P,(R) 


—> Ri y dy: P¿(R) — R? representaciones estándar de P¿(R) y P2(R) con 
respecto a 8 y y, respectivamente. Sea A = [T],; entonces 


0100 
A=|0 0 2 Ol]. 
0003 


Para ilustrar el Teorema 2.25, considérese al polinomio p(x) = 2 + 
x — 3x? + 5x?. Demostraremos que Lipg(p) = yT (p). 


Tenemos 
0.100 A 1 
Læ) =[o 0 2 0] | =[-S 
0.0031. 15 
5 
Pero como 


T(p) = p'= 1 — 6x + 15x, 
tenemos que 
1 


$ Tp) =|—6]. 
15 


Así, Lupa) = yT (p). 
Trátese de repetir este ejemplo con distintos polinomios p(x). 
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EJERCICIOS 


1. 


e 


3.* 


8.* 


10. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Para lo siguien- 
te, V y W serán espacios vectoriales con bases ordenadas (finitas) a y £, 
respectivamente, y T: VW—>W será lineal. A y B serán matrices. 

(a) (MA) = T. 

(b) T es invertible si y sólo si T es uno-a-uno y sobreyectiva. 

(c) T= L, donde A = [T]f. 

(d) M:x(F) es isomorfo a F’. 

(e) P,(F) es isomorfo a Pa(F) si y sólo si n = m. 

(f) AB=TI implica que A y B son invertibles. 

(2) (4) =A. 

(h) A es invertible si y sólo si L, es invertible. 

(i) A debe ser cuadrada para poder tener una inversa. 


Sean A y B matrices invertibles de n x n. Demostrar que AB es inver- 
tible y que (AB)? = BA”. 


Sea A invertible. Demostrar que A* es invertible y (4?) = (A7)?. 
Demostrar que si A es invertible y AB = O, entonces B = O. 

Si A? = O, demostrar que A no puede ser invertible. 

Demostrar los Corolarios 1 y 2 del Teorema 2.21. 


Sean A y B matrices de n x n tales que AB es invertible. Demostrar que A 
y B son invertibles. Demostrar que, en general, este resultado es falso si 
al menos una de las matrices no es cuadrada. 


Sean A y B matrices de n x n tales que AB = I,. Demostrar que A = B“ 
(y por lo tanto B = A"). (Decimos en efecto que para matrices cuadra- 
das una inversa unilateral es una inversa bilateral.) 


Demostrar que la transformación definida en el Ejemplo 28 es uno-a-uno. 
Demostrar el Teorema 2.24. 


Sea — tal que signifique “es isomorfo a”. Demostrar que — es una rela- 
ción de equivalencia sobre la clase de espacios vectoriales sobre F tal como 
se define en el Apéndice A. 


V = to E i : a, b, cer}. 
0 c 


Constrúyase un isomorfismo de V a F’. 


Sea 


13. 


14. 


16. 


17. 


18.* 


19. 
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Sean V y W espacios vectoriales dimensionalmente finitos y sea T: W—=W 


un isomorfismo. Si 8 es una base para V, demostrar que T(8) es una base 
para W. 


Sea B una matriz invertible de n x n. Defínase ©: Maxal F) > Mnxn (F) 
por $(4) = BAB. Demostrar que + es un isomorfismo. 


Sean V y W espacios vectoriales dimensionalmente finitos y sea T: V — W 
un isomorfismo. Sea V, un subespacio de V. 


(a) Demostrar que T(Vo) es un subespacio de W. 
(b) Demostrar que dim(V,) = dim(T(Vo)). 


Repetir el Ejempio 30 con el polinomio p(x) = 1 + x + 2x? + x. 


Sea V = M».2(R) el espacio vectorial de cuatro dimensiones de las matri- 
ces de 2 x 2 con elementos reales. Recuérdese del Ejemplo 4 que el mapeo 


T: V— V definido por T(4) = A't para toda A EV es una transformación 
lineal. 


(a) Sea B= (E", E}, E”, E”) donde Et es la matriz de 2 x 2 que 
tiene el elemento i, j igual a uno y el resto de los elementos iguales 
a cero. Demostrar que 8 es una base ordenada para V. 

(b) Sea A = [Tlg. Calcular A. 

(c) Sea 4 la representación estándar de V con respecto a 8. Entonces 
Lip = $T por el Teorema 2.25. Verificar esta igualdad para la 


matriz 
PO 
e) 
esto es, demostrar que Lip(M) = ¿T(M). 


Sea T: V— W una transformación lineal de un espacio vectorial n-dimen- 
sional V a un espacio m-dimensional W. Sean 8 y y bases ordenadas para 
V y W, respectivamente. Demostrar que rango(T) = rango(L,) y que nuli- 
dad(T) = nulidad(L,), donde A = [T];. Sugerencia: Utilizar el Teorema 
2.25 y el Ejercicio 15. 


Sean V y W espacios vectoriales dimensionalmente finitos con bases orde- 


nadas B = (X,, ... , Xn} Y y = {Yo --- >» Jm), respectivamente. Por el Teo- 
rema 2.7 existe una transformación lineal T;;: V— W tal que 


Yi sik= j 

Ti; N + . . 

i (xr) e si k Æj. 
Demostrar primero que {T;;: 1<i<m, 1<j<n} es una base para 
£(V, W). Entonces, sea Ei? una matriz de m x n con 1 en el renglón 
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i-ésimo y la columna j-ésima y O en cualquier otro lado, y demostrar que 
[T;;], = E“. De nuevo, por el Teorema 2.7 existe una transformación li- 
neal $: L(V, W) => Mmxn(F) tal que $(T;¡¡) = E“. Demostrar que $ es 
un isomorfismo. 


Sean Co, C1, ... , Cn elementos distintos de un campo F. Defínase T: P,(F) 

=> FP" por T(f) = (f(co), ... , f(ca)). Demostrar que T es un isomorfis- 

mo. Sugerencia: Utilizar los polinomios de Lagrange asociados con Co, 
iO 


Sea V el espacio vectorial de sucesiones finitas no nulas en F (definido en 
el Ejemplo 5 de la Sección 1.2), y sea W = P(F). Defínase 
T: V>W mediante T(0) = Y o(1D)x*, 
i=0 
donde n es el mayor de los enteros con una imagen no nula. Demostrar 
que T es un isomorfismo. 


LA MATRIZ DE CAMBIO DE COORDENADAS 


En muchas áreas de las matemáticas se utiliza a menudo un cambio de 
variable para simplificar la apariencia de una expresión. Por ejemplo, en 
cálculo puede encontrarse fácilmente una antiderivada de 2xe”* haciendo 
el cambio de variable u = x?. La expresión que resulta tiene una forma 
tan sencilla que la antiderivada se reconoce fácilmente: 


Jae” as = fea e" = er, 


De la misma forma, en geometría plana puede emplearse el cambio de 
variable 


para transformar la ecuación 2x? — 4xy + 5y? = 1 en la ecuación más 
sencilla 6(x')? + (y')? = 1 de cuya forma se reconoce fácilmente que se 
trata de la ecuación de una elipse. (Veremos en la Sección 7.7 cómo se 
determinó este cambio de variable.) Geométricamente, el cambio de va- 


riable 
>) x 
-> , 


equivale a una rotación de los ejes coordenados de manera que los ejes 
x y y coincidan con los ejes x’ y y”, respectivamente, donde 
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(Los valores de x’ y y” se encontraron al resolver el sistema 
—?2 ' , 


para x' y y' en términos de x y y.) Los vectores obtenidos al someter los 


vectores de la base 
1 0 
o) Y Uu 


del sistema coordenado x, y a esta rotación son 


vS -a 
A > |v3! 
5 5 


respectivamente. Estos vectores son vectores unitarios que se alojan en 
el eje x’ y el eje y”, respectivamente, y por lo tanto forman una nueva 


base 
L5 \ (224/53 
p= 5 5 
YI | ys 
5 5 
para R’. 


Surge una interrogante lógica: ¿Cómo es posible transformar vectores 
coordenados con respecto a una base, a vectores coordenados con respecto 
a la otra? La respuesta está dada a través de la relación 


APR EN 
5 5 


Nótese que la matriz 


es igual a [!];, donde | es la transformación identidad en R”. Entonces por 
el Teorema 2.16 [v]s = Olv]s. para toda vER?. Un resultado similar es 


cierto en general. 


Teorema 2.26. Sean B y f' dos bases ordenadas para un espacio vectorial di- 
mensionalmente finito V y sea Q = [ly]. Entonces 
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(a) Q es invertible. 
(b) Para toda v € V, [v]; = Q[v]».. 


DEMOSTRACIÓN. 


(a) Como ly es invertible, O también lo es por el Teorema 2.21. 
(b) Para toda v e V, 


[v]; = io) = [lye] = Ql] 
por el Teorema 2.16. MW 
La matriz Q definida en el Teorema 2.26 se llama matriz de cambio 


de coordenadas. A causa del inciso (b) del teorema decimos que Q trans- 
forma las coordenadas de f' en coordenadas de f. Obsérvese que si 


B5 AX, Xa..., An) y B = (Xx, Xx, ..., x/), entonces 
n 
x, = 3 Qijxi 
i-=1 
para j = 1, 2,... n, esto es, la columna j-ésima de Q es [x18. 


Ejemplo 31. Sea V= R, B= ((1, 1), (1, —1)), y 8 = {(2, 4), (3, 
1)). Como (2, 4) = 3(1, 1) — 1(1, —1) y (3, 1) =2(1, 1) +10, 
—1), la matriz que transforma las coordenadas de 8’ en coordenadas 


de £ es 
32 
g= i 1): 


1 3 
[Q, 4)ls = Q2, Al =Q 3 a E 


Así, por ejemplo, 


Supóngase ahora que T: V— W es una transformación lineal entre 
espacios vectoriales dimensionalmente finitos y que 8 y 8’ son bases orde- 
nadas para V y y y y' son bases ordenadas para W. Entonces T se puede 
representar por matrices relativas a B y y y relativas a 8’ y y’. ¿Cuál 
es la relación entre las matrices [T]; y [T]? La respuesta se ve clara- 
mente de las ecuaciones [T(v)], = [Thie] y TO] = [Tl;lv]s dadas 
por el Teorema 2.16, porque si Q y P son matrices de cambio de coor- 
denadas que transforman coordenadas de 8’ en coordenadas de 8 y 
coordenadas de y’ en coordenadas y, respectivamente, entonces de estas 
ecuaciones es evidente que hay dos métodos para obtener [T(v), a partir 
de [v],, como se ilustra en la figura 2.3. 

Como [Th Oiv]; = P[TI; [o], para toda v e V, el Teorema 2.17(b) 
implica que [TQ = P[TIz. Al ser P invertible (Teorema 2.26), esto da 
la respuesta a la pregunta anterior. 
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Teorema 2.27. Sea T: V—W una transformación lineal de un espacio vec- 


torial V dimensionalmente finito a un espacio vectorial W dimensionalmen- 
te finito, y sean B y 8' bases ordenadas para V y y y y' bases ordenadas 
para W. Entonces [T];,, = P-"[T¡O, donde Q es la matriz que transforma 
las coordenadas de f' en coordenadas de B y P es la matriz que transforma 
las coordenadas de y' en coordenadas de y. 


Multiplicar por [T] FS 


[olp ===> IT 


Multiplicar por Q Multiplicar por P 
(para transformar (para transformar 
coordenadas de 8’ en coordenadas de y' en 
coordenadas de £). coordenadas de y). 


Multiplicar por [T] Z 


lvl, O, 


figura 2.3 


Ejemplo 32. Sean V = Rè}, W= R? y T: V—W definida mediante 


Tla, -{ 2a, + a, ) 


a, + a, — ay 
a; 


Sean 8 y y las bases ordenadas estándar para R* y R”, respectivamente, 
y sean 


2 0 / 0 
E E a 


(Obsérvese que 8’ y y' son bases ordenadas para R* y R”, respectivamente.) 
Verificaremos el Teorema 2.27. Tenemos que 


edo TR W soga si d 
m= (, 1 a) a my = (; 0 2i) 


y algunos cálculos fáciles muestran que las matrices de cambio de coor- 
denadas que transforman coordenadas de 8’ en coordenadas de 8 y 
coordenadas de y’ en coordenadas de y son 


2 0 0 1 1 
0 0 —=2 
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respectivamente. En la Sección 3.2 se presentará un método para calcular 
P~; mientras tanto, verifíquese que 


O 
R -=(; Ea 


Una multiplicación fácil muestra que [T]; = P-"[T];0. 


Un caso particular importante del resultado anterior se tiene cuando 
V = W. Es esta la situación que nos ocupará primordialmente en una gran 
parte del resto del libro. En este caso el teorema toma la siguiente forma. 


Corolario. Sea T: V — V una transformación lineal en un espacio vectorial di- 
mensionalmente finito V que tiene bases ordenadas B y f'. Entonces 
[T]; = Q”[T]sQ, donde Q es la matriz que transforma coordenadas de 
B' en coordenadas de B. 


La relación entre las matrices [T]¿- y [T] del corolario anterior serán 
temas de estudio en los Capítulos 5 y 6. Sin embargo, introduciremos ahora 
el nombre de esta relación. 


Definición. Sean A y B matrices de n x n con elementos del campo F. Deci- 
mos que B es similar a A si existe una matriz invertible QE€EM,,,(F) tal 
que B = QA0O. 


Obsérvese que la relación de similaridad es una relación de equiva- 
lencia. (Ver el Ejercicio 7.) 

Nótese también que en esta terminología el corolario anterior puede 
enunciarse de la manera siguiente: Si T: V— V es una transformación 
lineal en un espacio vectorial dimensionalmente finito V, si 8 y 8’ son 
bases ordenadas cualesquiera para V, entonces [T]g. es similar a [T]g. 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Si Q es la matriz de cambio de coordenadas que transforma las 
coordenadas de 8’ en coordenadas de 8, donde f' = (x,..., x} y 
B= (Xi, ..., xn) son bases ordenadas para un espacio vectorial, 
entonces la columna j-ésima de Q es [x;]g.. 

(b) Toda matriz de cambio de coordenadas es invertible. 

(c) Sea T: V— W una transformación lineal de un espacio vectorial di- 
mensionalmente finito V a un espacio vectorial dimensionalmente 
finito W, y sean £ y 8’ bases ordenadas para V y y y y' bases ordenadas 
para W. Entonces [T]; = P[TI¡O, donde Q y P son las matrices de 
cambio de coordenadas que transforman coordenadas de 8’ en coor- 
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denadas de 8 y coordenadas de y en coordenadas de y”, respecti- 
vamente. 

(d) Las matrices A, BEMun(F) se llaman similares si B = QAQ para 
alguna Q EMnn(F). 

(e) Sea T: V— V una transformación lineal en un espacio vectorial di- 
mensionalmente finito V. Entonces para cualquier par de bases orde- 
nadas 8 y y para V, [T]g es similar a [T],. 


Para cada uno de los siguientes pares de bases ordenadas 8 y g’ para R?, 
encontrar la matriz de cambio de coordenadas que transforma coordenadas 
de 8’ en coordenadas de £. 


(a) B= [e,, e2} y B' = [Ca,, az), (b,, b2)) 

(b) 8= (1 3), (2, —1)} y £' = {(0, 10), (5, 0)) 
(c) B=1(Q, 5), (-1, -3)) y £' = [e,, ez) 

(d) B=((24, 3), (2, —1)) y £'= (GQ, 1), (+4, 1)) 


Para cada uno de los siguientes pares de bases ordenadas 8 y 8’ para 
P,(R), encontrar la matriz de cambio de coordenadas que transforma las 
coordenadas de 8’ en coordenadas de £. 


(a) 6=(x%B, x, 1) y 
B! = {ax + ax + do, bX + bix + bo, Cox? + cix + Co) 
(b) B=(1,x,x%) y 
B = {ax? + ax + ao bax? + bix + bo, Cox? + cix + Cp) 
(c) B= {2x2 — x, 3? + 1, x} y B'= (1, x, x?) 
(d) B=(2—=x+1,x+1,x+1) y 8 = (2 +x+ 4, 
dí — 3x + 2, 2x2 + 3) 
(e) Bela +1, x— 1}y g = {5r — 2x- 3, 
—2x + 5x + 5, 2x — x — 3} 
(6 B={2X2x— x+ 1, x +3x— 2, —x +2x+1}y 8" = (9-39, 
xX + 21x — 2, 3x? + 5x + 2} 


Sea V = R, W = R y T: V—W esté definida mediante 


3a, iga dz 
a; 
TÍ ) = 2a, + 4a, |. 
a, 
—4, + 4, 


Sean 8 y y bases ordenadas estándar para R? y R, respectivamente, y 


sean 
-D -EE 
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(a) Calcular A = [T], y B = MI. 

(b) Calcular O, la matriz de cambio de coordenadas que transforma las 
coordenadas de 8’ en coordenadas de £8, y P, la matriz de cambio 
de coordenadas que transforma coordenadas de y” en coordenadas 
de y. 

(c) Verificar que B= P-14Q0, considerando que 


1 0 0 
P= =|} 4 = 
0 0 1 


Sea T: P (R) —P,(R) definida por T(p) = p*, la derivada de p € P,(R). 
Sean 8 = {1, x} y 8 = {1 +x, 1— x}. 


(a) Encontrar la matriz de cambio de coordenadas Q que transforma las 
coordenadas de 8’ en coordenadas de £. 

(b) Encontrar Q. (Ver el Ejemplo 32.) 

(c) Calcular A = [Tlg y B = [Tlg- y verificar que B = Q*4Q. 


Demostrar el corolario del Teorema 2.27. 


Recordando la definición de una relación de equivalencia dada en el Apén- 
dice A, demostrar que la relación “es similar a” es una relación de equiva- 
lencia sobre Muxn(F). 


Demostrar que si A y B son matrices semejantes de n x n, entonces tr(4) 
= tr(B). Sugerencia: Utilizar el Ejercicio 12 de la Sección 2.3. 


Sea V un espacio vectorial dimensionalmente finito con bases ordenadas 
A, B y Y- 


(a) Demostrar que si Q y R son las matrices de cambio de coordenadas 
que transforman coordenadas de « en coordenadas de 8 y coorde- 
nadas de 8 en coordenadas de y, respectivamente, entonces RQ es 
la matriz de cambio de coordenadas que transforma coordenadas de 
œ en coordenadas de y. 

(b) Demostrar que si Q transforma coordenadas de « en coordenadas de 
f, entonces Q~ transforma coordenadas de 8 en coordenadas de a. 


Sea A una matriz de m x n con elementos de un campo F, y sean 8 y y 
bases ordenadas para F” y F", respectivamente. Sea B = [L,];. Demostrar 
que B = P"AQ donde P es la matriz de m x m con la columna j-ésima 
igual al vector j-ésimo en £ y Q es la matriz de n x n con la columna 
j-ésima igual al vector j-ésimo en y. 


11.* 


12.* 


2.6* 
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Sea V un espacio vectorial dimensionalmente finito sobre un campo F y 
sea B = [x,, ... , Xa} una base ordenada para V. Sea Q una matriz inver- 
tible de n x n con elementos de F. Defínase 

n . 

x= È Qix para I <j <n, 
i=1 
A t— A 1 

y hágase 8’ = {x', ..., x/). Demostrar que 8’ es una base para V y por 
lo tanto Q es la matriz de cambio de coordenadas que transforma coorde- 
nadas de 8’ en coordenadas de £. 


Demostrar la recíproca de Teorema 2.27: Si A y B son ambas matrices 
de m x n sobre un campo F y existen matrices invertibles P y Q de m x m 
y n x n, respectivamente, tales que B = PAQ, entonces existen un espacio 
vectorial n-dimensional V y un espacio vectorial m-dimensional W (ambos 


sobre F), bases ordenadas 8 y f£' para V y y y y' para W y una transfor- 
mación lineal T: VW—> W tal que 


=m; y B= D. 


Sugerencias: Sean V = F", W = F™, T = La y £ y y bases ordenadas están- 
dar para F” y F", respectivamente. Sea 8’ una base ordenada para V obte- 
nida a partir de 8 a través de Q (de acuerdo con la definición dada en 
la página 106 y justificada por el Ejercicio 11), y sea y” la base para W 
obtenida de y a través de P~. 


ESPACIOS DUALES 


En esta sección nos interesaremos exclusivamente en las transformaciones 
lineales de un espacio vectorial V en su campo de escalares F, que a su 
vez es un espacio vectorial de dimensión 1 sobre F. Tal transformación 
lineal se llama funcional lineal en V. En el cálculo, la integral definida nos 
proporciona uno de los ejemplos más importantes en matemáticas de 
una funcional lineal. (Ver Ejemplo 33.) Utilizaremos generalmente las 
letras f, g, h, ... para denotar a las funcionales lineales. 


Ejemplo 33. Sea V el espacio vectorial de funciones continuas complejas 
(o reales) sobre el intervalo [a, b]. La función f: V— C (o R) defini- 


da por 
f(x) = MEO 


es una funcional lineal en V. Si el intervalo es [0, 27] y n es un entero, 
la función definida por 


om 
h, (x) = a Soe dt 
0 
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también es una funcional lineal. En los textos de análisis al escalar h,(x) 
se le llama el n-ésimo coeficiente de Fourier de x. 


Ejemplo 34. Sea V = Mmxn(F) y defínase f: W=>F por f(A4) = tr(4), 
la traza de A. Por el Ejercicio 6 de la Sección 1.3, tenemos que f es una 
funcional lineal. 


Ejemplo 35. Sea V un espacio vectorial dimensionalmente finito con la 
base ordenada 8 = ([X,, X», ... , Xn}. Para cada i= 1,..., n, defínase 
f:(x) = a;i, donde 


es el vector de coordenadas de x relativo a 8. Entonces f; es una funcional 
lineal en V llamada la i-ésima función coordenada con respecto a la 
base B. Nótese que f¡(x;) = 8;;. Estas funcionales lineales jugarán un 
papel muy importante en la teoría de los espacios duales. (Ver el Teore- 
ma 2.28.) 


Definición. Para un espacio vectorial V sobre F, definimos al espacio dual de 
V como el espacio vectorial L(V, F), denotado por V*. 


Por tanto, V* es el espacio vectorial que consta de todas las funcio- 
nales lineales en V con las operaciones de suma y de multiplicación por 
escalares tal como se definieron en la Sección 2.2. Nótese que si V es 
dimensionalmente finito, entonces dim(V*) = dim(£(V, F)) = dim(vV) - 
dim(F) = dim(V). Por lo tanto, por el Teorema 2.22, V y V* son iso- 
morfos. También podemos definir el doble dual V** de V como el dual 
de V*, Demostraremos, de hecho, que existe una identificación natural de 
V y V**, 


Teorema 2.28. Supóngase que V es un espacio vectorial dimensionalmente fini- 
to con la base ordenada B = (Xi, ... , Xn}. Sean f,(1 <i<mn) las fun- 
ciones coordenadas con respecto a fB tal como se definieron anteriormente 
y sea B* =([f,, ..., fn}. Entonces B* es una base ordenada para V*, 
y para cualquier f €V* tenemos que 


f= 5x). 


Llamamos a fB* la base dual de B. 
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DEMOSTRACIÓN. Sea f€V*, Como dim(V*) = n, sólo necesitamos pro- 
bar que 
f= 5 f(x) fi, 
í=1 
porque entonces 8* generará a V*. Sea 
g= Bf). 
í=1 


Para 1 < j < n, tenemos que 


Il 


9) = (Šat) 6) = Š taDt) 


S f(x;)8;; = Fx). 


Por lo tanto, por el corolario del Teorema 2.7, g = f, por lo que el teore- 
ma queda demostrado. PM 


Ejemplo 36. Sea 8 = {(2, 1), (3, 1)} una base ordenada para R?. De- 
terminaremos explícitamente la base dual 6* = {fı, f2} de 8. Necesitamos 
considerar las ecuaciones: 


1 = fi(2, 1) = fi (Qe, + e) = 2f,(e,) + filez) 
0=4,(3, 1) = fi (e, + €,) = 3f,(e,) + fı (ez). 


Resolviéndolas tenemos que f,(e,)=—1 y f,(e,) = 3 es decir que 
f(x, y) = —x + 3y. De manera semejante puede probarse que f(x, 
y) =x —2y. 


Ahora supondremos que V y W son espacios vectoriales dimensional- 
mente finitos sobre F con bases ordenadas 8 y y, respectivamente. En la 
Sección 2.4 demostramos que existe una correspondencia uno-a-uno entre 
las transformaciones lineales T: V— W y las matrices de m x n (sobre 
F) por medio de la correspondencia T <= [TI;. Para una matriz de la for- 
ma A = [T], la pregunta es si existe o no una transformación lineal U 
asociada con T de alguna manera natural tal que U pueda representarse 
en alguna base como A*. Por supuesto, si m Æ+ n, sería imposible para U 
ser una transformación lineal de V en W. Resolveremos esta pregunta 
aplicando lo que ya hemos aprendido sobre espacios duales. 


Teorema 2.29. Sean V y W espacios vectoriales dimensionalmente finitos sobre 
F con bases ordenadas f y y, respectivamente. Para cualquier transforma- 
ción lineal T: W=>W, el mapeo Tt: W* —>V* definido por T(g) = 
goT para toda g EW* es una transformación lineal con la propiedad de 
que [T] = (T). 
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DEMOSTRACIÓN. Para g €W*, es evidente que T*(g) = goT es una fun- 
ción lineal en V y por lo tanto es un elemento de V*. Así, Tf mapea a W* 
en V*. Dejaremos al lector la demostración de que T’ es lineal. 
Para completar la demostración sean 8B = [x,, ..., Xn} y y= (Ys 
. , Ym} con bases duales 8* = [f,, ... , fa} y y* = [91 -<-s Im), TEs- 
pectivamente. Por conveniencia, sean A = [T]; y B = [T']f.. Entonces 


T(x) = SY AxiYe para 1 <i<n, 


k=1 


Ti (g;) = 5 B;;fi para 1 < j < m. 


1=1 
Debemos demostrar que B = A*t. El Teorema 2.28 muestra que 
T'(g;) = g; T = Y (g; ° T) (x:)f;, 
i=1 


y entonces 


l 


EEE E ET ( S Aro) 
k=1 


ll 


D Ari9(Yr) = Y Aridi = Aj = (A) ij. 
k=1 


k=1 


Por lo tanto B = At. B 


La transformación lineal T* definida en el Teorema 2.29 se llama trans- 
puesta de T. Es evidente que T* es la única transformación lineal U tal 
que [UT = ([T];)*. 

Ahora nos ocuparemos de la demostración de que cualquier espacio 
vectorial dimensionalmente finito V puede ser identificado de una manera 
muy natural con su doble dual V**, Produciremos, de hecho, un isomor- 
fismo entre V y V** que no dependerá de ninguna selección de bases para 
los dos espacios vectoriales. 

Para un vector x €V definimos £: V*— F por X(f) = f(x) para toda 
fEV*. Es fácil verificar que £ es una funcional lineal en V* y entonces 
XEV**. La correspondencia x «>£ nos permitirá definir el isomorfismo 
deseado entre V y V**, 


Sea V un espacio vectorial dimensionalmente finito y sea xEV. Si 
2(f) = O para toda fEV*, entonces x = Q. 


DEMOSTRACIÓN. Si x>40 entonces podemos tomar una base ordenada 
B=1(%,..., xn) para V tal que x, = x. Sea ([f,, ... , fn} la base dual 
de 8. Entonces se tiene que f,(x,) = 1.40 lo que es una contradicción. 
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Teorema 2.30. Sea V un espacio vectorial dimensionalmente finito y sea y: 


V>V** que esté definida por y(x) = R. Entonces y es un isomorfismo. 
DEMOSTRACIÓN. 


(a) yes lineal: Sea x, y EV y a€F. Para f €V* tenemos que 


y(x + ay) (f) = f(x + ay) = f(x) + af(y) = X(8) + ap (f) 
= (£ + aC). 


H 


Por lo tanto 
y(x + ay) =£ + aĵ = y(x) + ap (y). 


(b) y es uno-a-uno: Supóngase que y(x) es la funcional cero en V* 
para alguna x €V. Entonces £(f) = O para toda f €V*. Por el lema ante- 
rior concluimos que x = 0. 

(c) y es un isomorfismo: Esto se deduce de (b) y del hecho de que 
dim(V) = dim(V**). E 


Corolario. Sea V ún espacio vectorial dimensionalmente finito con un espacio 


dual V*. Entonces, toda base ordenada de V* es la base dual de alguna 
base de V. 


DEMOSTRACIÓN. Sea (f,,... , fn} una base ordenada de V*. Podemos 
combinar los Teoremas 2.28 y 2.30 para concluir que para esta base de 
V* existe una base dual (X,,...,X,) en V**, esto es 8; = £; (fi) = f,(x;). 
Por tanto ([f,, ... , fn} es la base dual de (x,, ..., xn). E 


Aun cuando muchas de las ideas de esta sección se pueden extender 
para el caso donde V no es dimensionalmente finito, por ejemplo la exis- 
tencia de un espacio dual, únicamente un espacio vectorial dimensionalmen- 
te finito es isomorfo a su doble dual a través del mapeo x — £. De hecho, 
para espacios vectoriales dimensionalmente infinitos, V y V* nunca son 
isomorfos. 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
todos los espacios vectoriales son dimensionalmente finitos. 


(a) Toda transformación lineal es una funcional lineal. 

(b) Una funcional lineal definida en un campo puede ser representada 
como una matriz de 1 x 1. 

(c) Todo espacio vectorial es isomorfo a su espacio dual. 

(d) Todo espacio vectorial es el dual de algún otro espacio vectorial. 

(e) Si T es un isomorfismo de V en V* y 8 es una base ordenada finita 


de V, entonces T(8) = £*. 
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(£) Si T es una transformación lineal de V en W, entonces el dominio 
de (Tt)? es V**, 
(g) Si V es isomorfo a W, entonces V* es isomorfo a W*. 
(h) La derivada de una función puede considerarse como una funcional 
lineal en el espacio vectorial de funciones diferenciables. 
Para las siguientes funciones en un espacio vectorial V, determinar cuáles 
son funcionales lineales. 
(a) V.=P(R); f(p) = 2p'(0) + p”(1), donde ’ significa diferenciación 
(b) = R?; f(x, y) = (2x, 4y) 
(c) V = Max(F);f(4) = tr(4) 
(d) V= R; f(x,y,z) 5r ty tz 
(e) V= P(R); fp) = f p(t)dt 
0 

(£) V = Max (R); FA) = An 
Como en el Ejemplo 36, para todos los espacios vectoriales V y bases f 
que aparecen a continuación, encontrar la base dual 8* para V*, 
(a) V=R%8=((1,0, 1), (1,2, 1), (0, 0, 1)) 
(b) V=PAR); 8 = {1, x, x°} 
Sea V = R? y defínase fı, f2, fs EV* mediante f, (x, y, z) = x — 2y, fa(x, y, 
z) =x+y+2 y f(x, y, 2) = y — 3z. Demostrar que (f,, fz, fs} es una 
base para V* y luego encontrar una base para V para la cual sea el dual. 
Sea V = P,(R) y para p €V defínase f,, f € V* mediante 

1 

f.(p) = f p(i)di 
0 

y 

2 

t.(p) = f pdt. 

0 
Demostrar que (f,, f.) es una base para V* y encontrar una base para V 
para la cual sea el dual. 
Defínase fE(R?)* mediante f(x, y) = 2x + y y T: R?— R? mediante 


T(x, y) = (3x + 2y, x). 

(a) Calcular T*(f). 

(b) Calcular [T*],,,donde 8 es la base ordenada estándar para R? y 8* = 
[f,, f2} encontrando escalares a, b, c y d tales que T'(f,) = af, + bf: 
y Tf) = cf, + dfo. 

(c) Calcular [Tlg y [T] y comparar los resultados con los del inciso 


(b). 


7. 


10. 
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Sean V = P,(R) y W = R? con sus respectivas bases ordenadas 8 = (1, x} 
y y= (e, e}. Defínase T: V—>W mediante T(p) = (p(0) — 2p(1), 
p(0) + p'(0)), donde p’ es la derivada de p. 


(a) Si fEW* está definida por 
f(a, b) = a — 2b, 


calcular T*(f). 

(b) Calcular [T*]f$ sin recurrir al Teorema 2.29. 

(c) Calcular [T]; y su transpuesta y comparar el resultado con el del in- 
ciso (b). 


Demostrar que todo plano que pasa por el origen en R* puede ser identifi- 
cado con el espacio nulo de un elemento en (R*)*. Enunciar un resultado 
semejante en R?. 


Sea T una función de F” en F™. Demostrar que T es lineal si y sólo si existen 
fi, ..., fm E (F°)* tales que T(x) = (f(x), ... , fm(x)) para toda x €F”. 
Sugerencia: Si T es lineal, defínase f,(x) = (g:° T)(x) para x €F"; es de- 
cir, f; = Tt(g:) para 1 < i < m, donde (g;,, ... , Jm} es la base dual de 
la base ordenada estándar de F™. 


Sea V = Pa (F) y sean co, ... , Cn, escalares distintos en F. 


(a) Para 0< i< n defínase f; €V* mediante f,(p) = p(c;). Demostrar 
que (fo, ... , fn} es una base de V*. Sugerencia: Aplicar cualquier 
combinación lineal de este conjunto que iguale la transformación cero 
con p(t) = (1— cc) (t — cz): (t — Ca) y deducir que el primer 
coeficiente es cero. 

(b) Utilizar el corolario del Teorema 2.30 y el inciso (a) para demostrar 
que existen polinomios únicos Po, ... , Pn tales que p;(c;) = ŝi; para 
O < i< n. Estos polinomios son los polinomios de Lagrange defini- 
dos en la Sección 1.6. 

(c) Para escalares cualesquiera ao, ... , An (no necesariamente distintos), 
dedúzcase que existe un polinomio único q de grado n tal que 
q(c:) = a; para O <i <n. De hecho 


q = È api. 
i=0 
(d) Deducir la fórmula de interpolación de Lagrange: 
p= ®© p(ci)Ppi 
i=0 
para toda p €V. 
(e) Demostrar que 


b n 
f p(Ðdt = Y p(ci)di, 
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donde 


Supóngase ahora que 


y Hb=a) 
n 


ci=a para ¿=0,..., n. 
Para n= 1 la expresión anterior representa la regla trapezoidal para 


polinomios. Para n = 2, comparar el resultado con la regla de Simp- 
son para polinomios. 


Sean V y W espacios vectoriales dimensionalmente finitos sobre F, y sean 
Y. y y. isomorfismos entre V y V** y W y W**, respectivamente, tal como 


.se definieron en el Teorema 2.30. Sea T: V—W lineal, y defínase 


T! = (T*)*, Demostrar que el diagrama de la figura 2.4 conmuta, es decir, 


que yT = Tity. 


y** —— W** 


T“ 


figura 2.4 


Sea V un espacio vectorial dimensionalmente finito con la base ordenada 
8. Demostrar que y(8) = 8**, donde y es como se definió en el Teore- 
ma 2.30. 

Para los problemas 13 a 17, V será un espacio vectorial dimensional- 
mente finito sobre F. Si S es un subconjunto de V, definimos al aniquilador 
S° de S como $ = (fEV*: f(x) =0 para toda x €S}. 


(a) Demostrar que $” es un subespacio de V*. 

(b) Si W es un subespacio de V y x£W, demostrar que existe f€ WO tal 
que f(x) 40. 

(c) Demostrar que $° = L(y(S)), donde y es como se definió en el 
Teorema 2.30. 

(d) Para los subespacios W, y W., demostrar que W, = W, si y sólo si 
Wo = WO. 

1 2 

(e) Para los subespacios W, y W., demostrar que (W, + W)? = 

wn wo, 


14. 


15. 


16. 


17. 


2.7* 
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Si W es un subespacio de V, demostrar que dim(W) + dim(W°) = dim(V). 


Sugerencia: Sea ([x,,... , Xx} una base ordenada de W y extiéndase a 
una base ordenada 8 = [x,, ... , Xa} de V. Sea B* = [f,, ... , fn}. De- 
mostrar que (fk,1, ... , fn} es una base de W°. 


Supóngase que W es un espacio vectorial dimensionalmente finito sobre F 
y que T: VW es lineal. Demostrar que N(T*) = (R(T))". 


Utilizar los Ejercicios 14 y 15 para deducir que rango(4) = rango(4*) 
para toda A € Mmxn (F). 


Sea T: V— V una transformación lineal y W un subespacio de V. Demos- 
trar que W es T-invariante (tal como se definió en el Ejercicio 24 de la 
Sección 2.1) si y sólo si W° es T*-invariante. 


ECUACIONES DIFERENCIALES LINEALES HOMOGENEAS 
CON COEFICIENTES CONSTANTES 


A manera de introducción a esta sección, consideremos el siguiente pro- 
blema físico. Un peso de masa m se sujeta a un resorte suspendido verti- 
calmente al que se le permite elongarse hasta que las fuerzas que obran 
sobre el peso están en equilibrio. Supongamos ahora que el peso permane- 
ce en reposo y superpongamos un sistema coordenado XY con el peso 


en el origen y el resorte localizado en la parte superior del eje Y. (Ver 
Fig. 2.5.) 


figura 2.5 


Supóngase que en un cierto instante, por ejemplo f = 0, el peso se 
hace descender una distancia s a lo largo del eje Y y luego se suelta. 
Entonces el resorte empezará a oscilar. 

Describamos el movimiento del resorte. En cualquier instante £ > 0, 
sea F(t) la fuerza que actúa sobre el peso y y(t) sea la coordenada del 
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peso a lo largo del eje Y. Por ejemplo, y(0) = —s. La segunda derivada 
de y con respecto al tiempo, y” (1), es la aceleración del peso en el ins- 
tante £, y por lo tanto de acuerdo con la segunda ley de Newton 


F(t) = my" (t). (1) 


Es razonable suponer que la fuerza que actúa sobre el peso se debe 
totalmente a la tensión del resorte y que esta fuerza satisface la ley de 
Hooke: La fuerza que actúa sobre el peso es proporcional a su despla- 
zamiento a partir de la posición de equilibrio, pero en dirección opuesta. 
Si k > 0 es la constante de proporcionalidad, entonces la ley de Hooke 
establece que 


F(t) = =ky(). (2) 
Combinando las ecuaciones (1) y (2), obtenemos 
my" = —ky 
o bien 
y” + Ly =0. (3) 


La expresión de la ecuación (3) es un ejemplo de “ecuación diferen- 
cial”. Una ecuación diferencial en una función incógnita y = y(t) es una 
ecuación que involucra a y, a t y a las derivadas de y. Si la ecuación 
diferencial es de la forma 


any ™® + any" +... +ay™ + amy Í, (4) 


donde a., a,, ... , a, y f son funciones de 1 y y” es la k-ésima derivada 
de y, entonces se dice que la ecuación es lineal. Las funciones a; se deno- 
minan coeficientes de la ecuación diferencial lineal (4). Así, la ecuación 
(3) es un ejemplo de ecuación diferencial lineal en donde los coeficientes 
son constantes y la función f es idéntica a cero.'Cuando la función f de 
la ecuación (4) es idéntica a cero, la ecuación diferencial lineal se llama 
homogénea. 

En esta sección aplicaremos el álgebra lineal que hemos estudiado 
para resolver ecuaciones diferenciales lineales homogéneas con coeficien- 
tes constantes. Si a, +0, decimos que la ecuación diferencial (4) es de 
orden n. En este caso podemos dividir ambos lados entre a, para obtener 
una ecuación nueva pero equivalente 


y + bpay O +... yO + boy = 0, 


donde b; = ai/ān„ para i = 0, 1,..., n — 1. A causa de esta observación 
supondremos siempre que el coeficiente inicial a, de la ecuación (4) es 1. 

Una solución a la ecuación (4) es una función tal que cuando se subs- 
tituye en y reduce la ecuación (4) a una identidad. 
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Ejemplo 37. La función y(t) = sen VKk/mt es una solución a la ecua- 
ción (3) puesto que 


k k k k k 
y" (D) + —y(t) = —— sen y£ + — sen ye =0 
m m m m m 


para toda f. Nótese, sin embargo, que al substituir y(1) = t en la ecua- 
ción (3) se obtiene 


k k 
y”) + —y() = —, 
m m 


; lo cual no es idénticamente cero. Por tanto, y(t) = t no es solución a la 
k ecuación (3). 


Al intentar resolver ecuaciones diferenciales, descubriremos que es de 
utilidad considerar las soluciones como funciones complejas de una varia- 
ble real, aun cuando las soluciones que para nosotros tienen significado 
son las funciones reales de variable real. La conveniencia de este punto 
de vista se hará más claro posteriormente. Así, nos ocuparemos del espa- 
cio vectorial F(R, C) (tal como se definió en el Ejemplo 3 de la Sec- 
ción 1.2). A fin de considerar a las funciones complejas de variable real 
como soluciones a las ecuaciones diferenciales debemos definir lo que 
significa diferenciar tales funciones. Dada una función compleja x EF(R, C) 
de una variable real 1, existen funciones reales únicas x, y x de £, tales que 


x(O = x(t) + ix(t) para tER, 
donde i es el número imaginario puro tal que i? = —1. Decimos que x, 


es la parte real y que x es la parte imaginaria de x. 


Definición. Dada una función x €F(R, C) con parte real x, y parte imaginaria 
Xə, decimos que x es diferenciable si X, y Xə son diferenciables. Si X es 
diferenciable definimos la derivada de x, x’ como 


y ym r ET 
xX Xx, FAX). 


Ejemplo 38. Si x(t) = cos 21 + i sen 2t, entonces 
x(t) = —2 sen 2t + ¡(2 cos 2t). 
Determinamos a continuación la parte real e imaginaria de x*. Como 
x(t) = (cos 21 + isen 21)? = (cos? 2t — sen? 21) + i(2 sen 21 cos 21) 
= cos 4t + i sen 4t, 


la parte real de x?(1) es cos 4t y la parte imaginaria es sen 41. 


El teorema siguiente indica que debemos limitar nuestras investigacio- 
nes a un espacio vectorial considerablemente menor que F(R, C). Su de- 


122 Transformaciones lineales y matrices 


mostración, ilustrada en el Ejemplo 39, implica un sencillo argumento de 
inducción, la cual omitiremos. 


Teorema 2.31. Cualquier solución a una ecuación diferencial lineal homogénea 
con coeficientes constantes tiene derivadas de todos los órdenes; esto es, 
si x es una solución para tal ecuación, entonces x’ existe para todo ente- 
ro positivo k. 


Ejemplo 39. Como ilustración del Teorema 2.31 considérese la ecuación 
y? +4y=0. 


Claramente, para ser calificada como solución, una función y debe tener 
dos derivadas. Sin embargo, si y es una solución, 


ya = — 4y. 


Ahora, como y” es un múltiplo constante de una función que tiene 
dos derivadas, a saber la función y, y’? debe tener dos derivadas y enton- 
ces y'* existe. De hecho 


yD = —-4y0, 


Como y(** es un múltiplo constante de una función que hemos mostrado 
que tiene al menos dos derivadas, también tiene al menos dos derivadas, 
y por lo tanto y“ existe. Continuando de esta manera podemos demostrar 
que cualquier solución tiene derivadas de todos los órdenes. 


Definición. Utilizaremos el símbolo C* para representar al conjunto de todas 
las funciones en F(R, C) que tienen derivadas de todos los órdenes. 


Es un ejercicio sencillo demostrar que C* es un subespacio de F(R, C) 
y, por tanto, un espacio vectorial sobre C. Como resultado del Teorema 
2.31 es este espacio vectorial el que nos interesa. Para x €C* la derivada 
x’ de x también está en C”. Podemos utilizar la operación derivada para 
definir un mapeo D: C* — C” mediante 


D(x) = x para x €C”. 


Es fácil demostrar que D es una transformación lineal. Más generalmente, 
considérese cualquier polinomio sobre C de la forma 


p(t) == ant" + Or A F .. + at AP a. 
Entonces 
p(D) = aD” + anD!) +... +4D=+asl 


es una transformación lineal. (Ver el Apéndice E.) 
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Definiciones. Para cualquier polinomio p(t) sobre C, p(D) se llama operador 
diferencial. El orden del operador diferencial p(D) es el grado del polino- 
mio p(t). 


Los operadores diferenciales son útiles porque nos proporcionan me- 
dios para reformular una ecuación diferencial dentro del contexto del 
álgebra lineal. Cualquier ecuación diferencial lineal homogénea con coefi- 
cientes constantes 


yO + any P +... ay a 
puede ser escrita de nuevo por medio de operadores diferenciales como 


(D” + anD! +... + aD + ad) (y) = 0. 


Definición. Dada la ecuación diferencial anterior, el polinomio complejo 
p(t) = t + aıt! +... t at tao 
se llama polinomio auxiliar asociado con la ecuación. 
Por ejemplo, la ecuación (3) tiene el polinomio auxiliar 


pD) =P TE 
m 


Cualquier ecuación diferencial lineal homogénea con coeficientes cons- 
tantes puede reescribirse como 


p(D)(y) =0, 


donde p(t) es el polinomio auxiliar asociado con la ecuación. Claramente 
esta ecuación implica lo siguiente. 


Teorema 2.32. El conjunto de todas las soluciones a una ecuación diferencial 
lineal homogénea con coeficientes constantes coincide con el espacio nulo 
de p(D), donde p(t) es el polinomio auxiliar asociado con la ecuación. 


Corolario. El conjunto de todas las soluciones a una ecuación diferencial lineal 
homogénea con coeficientes constantes es un subespacio de C”. 


En vista del corolario anterior, llamaremos al conjunto de soluciones 
a una ecuación diferencial lineal homogénea con coeficientes constantes, 
el espacio solución de la ecuación. Una manera práctica de describir tal 
espacio es encontrar una base para él. Examinaremos una cierta clase de 
funciones que serán de utilidad para encontrar bases para estos espacios 
solución. 

Para un número real s, ya estamos familiarizados con el número real 
e*, donde e es el número único cuyo logaritmo natural es 1 (esto es, 
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In(e) = 1). Por ejemplo, conocemos algunas propiedades de la exponen- 
ciación: 
1 


8+t — pg8pt t = 
e ere y e oi 


para cualquier par de números reales s y 1. Extenderemos ahora la defi- 
nición de las potencias de e para incluir a los números complejos de tal 
modo que estas propiedades continúen siendo válidas. 


Definición. Sea c = a + ib cualquier número complejo con parte real a y parte 
imaginaria b. Definase 


e” = e*r(cos b + i sen b). 
Por ejemplo, para c = 2 + ¿(7/3), 


c= el m ; T = e? 1 23) 
e e (cos Z+ i sen 7) e Fr . 


Claramente, si c es real (b = 0), obtenemos el resultado usual e° = e“, 
Puede demostrarse con el uso de identidades trigonométricas que 
1 


perl = e tel y eE = — 
e” 


para cualquier par de complejos c y d. 


Definición. Sea c cualquier número complejo. La función f: R—>C definida 
por f(t) = e*t para toda t en R se llama función exponencial. 


La derivada de una función exponencial, como se describe en el teore- 
ma siguiente, es como esperaríamos. La demostración implica un cálculo 
directo, aunque tedioso, que dejaremos como ejercicio. 


Teorema 2.33. Para cualquier función exponencial f(t) = e*t, f' (t) = cet, 


Utilizaremos funciones exponenciales para describir todas las solucio- 
nes de una ecuación diferencial lineal homogénea de orden 1. Recuérdese 
que el orden de dicha ecuación es igual al grado de su polinomio auxiliar, 
de manera que una ecuación de orden 1 es de la forma 


y+ay=0 (5) 


Teorema 2.34. El espacio solución para la ecuación (5) es de dimensión 1 y 
tiene a {e®*} como base. 


DEMOSTRACIÓN. Claramente, la ecuación (5) tiene a e“ como solución. 
Supóngase que x(1) es una solución cualquiera a la ecuación (5). En- 
tonces 


x' (t) = —ax(t) para toda tER. 
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Defínase 
z(t) = entx(t). 
Al diferenciar z obtenemos 
z(t) = (e+ )'x(t) + etx (1) = ayertx(t) — aset x(t) = 0. 


Nótese que la conocida regla para la diferenciación de productos se 
conserva para funciones complejas de variable real. Una justificación impli- 
ca un cálculo directo aunque bastante largo. 

Como 7z’ es idénticamente cero, z es una función constante. De nuevo, 
este hecho, muy conocido para funciones reales de variable real, también 
es cierto para funciones complejas; la demostración, semejante a la que se 
hace para el caso real, implica considerar poy separado las partes real e 
imaginaria de z. Entonces, existe un número complejo c tal que 


zZ(1) = evtx(t) =c para toda (ER. 
Así, 
x(t) = cert, 


De donde concluimos que cualquier miembro del espacio solución de la 
ecuación (5) es una combinación lineal de e. I 


Otra manera de formular el Teorema 2.34 es la siguiente. 


Corolario. Para cualquier número complejo c, el espacio nulo del operador dife- 


rencial D — cl tiene como base a {e*}. 


Nos ocuparemos ahora de ecuaciones diferenciales de orden superior 
a uno. Dada una ecuación diferencial lineal homogénea de orden n con 
coeficientes constantes 


y™ + A E + ay = 0, 
su polinomio auxiliar 
DIO). = C + anit + ... +at + ao 
se descompone en un producto de factores de grado 1: 
p() = (t= c) (t— c)... (£— Car), 


donde c4, Cz, . .. , Ca son números complejos (no necesariamente distintos). 
(Esto se deduce del teorema fundamental del álgebra dado en el Apén- 
dice D.) Entonces 


p(D) = (D— &!)(D— cl)... (D— cal). 


Pero los operadores D — c;¡l conmutan y así, por el Ejercicio 9, tenemos 
que 
N(D — cil) C N(p(D)) para toda i. 
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Como N(p(D)) coincide con el espacio solución de la ecuación diferen- 
cial dada, podemos concluir el siguiente resultado por el corolario del 
Teorema 2.34. 


Teorema 2.35. Sea p(t) el polinomio auxiliar para una ecuación diferencial li- 


neal homogénea con coeficientes constantes. Para cualquier número com- 
plejo c, si c es un cero de p(t), entonces e*t es una solución a la ecuación 
diferencial. 


Ejemplo 40. Dada la ecuación diferencial 
y” = 3y+2y=0, 
su polinomio auxiliar p(t) = * — 3t + 2 se puede factorizar como 
p(t) = (1= 1)(1— 2). 


Por tanto, por el Teorema 2.35, e! y e** son soluciones de la ecuación 
anterior porque c = 1 y c = 2 son ceros de p(t). Como el espacio solu- 
ción de la ecuación anterior es un subespacio de C”, L((e*, e?t)) se en- 
cuentra en el espacio solución. Es sencillo demostrar que (et, et) es 
linealmente independiente y si pudiéramos demostrar que el espacio solu- 
ción es bidimensional, podríamos concluir que {e*, e?) es una base para 
el espacio solución. Este resultado se deduce del teorema siguiente. 


Teorema 2.36. Para cualquier operador diferencial p(D) de orden n, el espa- 


Lema 


cio nulo de p(D) es un subespacio n-dimensional de C*. 


Como preliminares de la demostración del Teorema 2.36 establecere- 
mos dos lemas. 


1. El operador diferencial D— cl: C” > C” es sobreyectivo para cual- 
quier número complejo C. 


DEMOSTRACIÓN. Sea x€C”. Deseamos encontrar un yEC” tal que 
(D — cl)y = x. Defínase una función w mediante w(t) = x(t)e** para 
LER. 


Claramente, w €C” pues x y e! están en C”. Sean respectivamente 
w, y wz las partes real e imaginaria de w. Como wE€C*, w, y w son 
diferenciables y por tanto continuas, por lo que tienen antiderivadas, diga- 
mos que son W, y W, tales que W! = w, y W,=w,. Defínase W: 
R => C mediante 


W(t) = WD + ¡W.(0) para 1ER. 


Entonces W €C” y las partes real e imaginaria de W son W, y W., 
respectivamente. También W’ = w. Finalmente, defínase y: R=>C me- 
diante y(t) = W(t)et para tER. 
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Claramente, y €C* y como 


(D— cl)y(t) = y (1) — cy(t) 
= W(De*t + W(t)cet — cW (t)ett 
= w(t)e“t 
= x(0) e “tec! 
= x(t), 
(D—c)y=x. B 


' 


Lema 2. Sea V un espacio vectorial y supóngase que T y U son operadores li- 
neales en V tales que 


(a) U es sobreyectiva. 
(b) Los espacios nulos de T y U son dimensionalmente finitos. En- 
tonces el espacio nulo de TU es dimensionalmente finito y 


dim(N(TU)) = dim(N(T)) + dim(N(U)). 


DEMOSTRACIÓN. Sean p = dim(N(T)), q = dim(N(U)) y (Ur, Ur ..., 
Up) Y [V1, Vz, ... , Va} sean bases para N(T) y N(U), respectivamente. 
Como U es sobreyectiva podemos seleccionar para cada i(i = 1,..., p) 
un elemento w; EV tal que U(w;) = u;. Entonces obtenemos un conjunto 
de p elementos (w,, w2, ... , Wp}. Nótese que para cualquier i y j, w; Æ Vj 
puesto que de otra manera u; = U(w;) = U(v;) = 0 lo que es una con- 
tradicción. Por lo tanto, el conjunto 


B = [W,, Wa, ..., Wo, Vi)... , Va) 


contiene p + q elementos diferentes. Para demostrar el lema es suficiente 
demostrar que 68 es una base para N(TU). 
Demostraremos primero que 8 genera a N(TU). Como para toda w; 


y v; en $8 
TU(w;¡) =T(u:) =0 y TU(v;) = T(0) =0, 
B E NCTU). 
Ahora supóngase que v € N(TU). Entonces 
0 = TU(v) = T(U(v)). 


Así, tenemos que U(v) EN(T) y existirán escalares a,, a;, ... , Ap tales 
que 
U(v) = du, + aua + ... + App 


U(a,w, + aw + ... + aw»). 


Por lo tanto 


Ulv — (aw, + aw: + ... + apwp)) = 0. 


128 


Transformaciones lineales y matrices 


Concluimos que v — (aiw, + ... + a7w,) está en N(U). De aquí se sigue 
que existen escalares b,, b», ... , b, tales que 


v — (aw, + d2W2 + ... + apwp) = bivi + beve +... + bova 


4 
v = aw + aw +... + apwp + bivi + beva +... + biva. 


Por lo tanto 8 genera a N(TU). 
Demostraremos ahora que 8 es linealmente independiente. Sean a,, 
Az... , Ap, Di, bz, ... , ba escalares arbitrarios tales que 


aw, + aW + ... + apwp t bivi t beva + ... + bova = 0. (6) 
Aplicando U en ambos lados de la ecuación (6), obtenemos 


AU, + aus + ... + apup = 0. 


Así, la ecuación (6) se reduce a 


Como (u,, Uz, ... , Up) es linealmente independiente, todas las a; son cero. 


bir, + bava + ... + bova = 0. 


Ahora, la independencia lineal de (v,, və, ... , V¿) implica que las b; son 
todas cero. Concluimos entonces que 8 es una base para N(TU). Por lo 
tanto, N(TU) es dimensionalmente finito y dim(N(TU)) = p + q = dim 
(N(T)) + dim(N(U)). E 


DEMOSTRACIÓN DEL TEOREMA 2.36. La demostración requerirá de un ar- 
gumento de inducción matemática sobre el orden del operador diferencial 
p(D). El caso de primer orden coincide con el Teorema 2.34. Entonces, 
para algún entero n > 1 supóngase que el Teorema 2.36 se satisface para 
cualquier operador diferencial de orden menor que n y supóngase que se 
tiene un operador diferencial p(D) de orden n. El polinomio p(t) puede 
descomponerse en un producto de dos polinomios 


pt) =q(0) (1 — c) 
para algún polinomio q(t) de grado n — 1 y para algún número comple- 
jo c. Entonces, el operador diferencial dado puede reescribirse como 
p(D) = q(D)(D — cl). 


De acuerdo con el Lema 1, D — cl es sobreyectivo; por el corolario del 
Teorema 2.34 dim(N(D — cl)) = 1; y por la hipótesis de inducción 
dim(N(qg(D)) = n — 1. Luego, al aplicar el Lema 2 concluimos que 

dim(N(p(D))) = dim(N(q(D))) + dim(N(D — cl)) 
=(n-1)+1=n E 


vaa 
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Corolario. Para cualquier ecuación diferencial lineal homogénea con coeficientes 


constantes, el espacio solución es un subespacio n-dimensional de C?. 


El corolario del Teorema 2.36 reduce el problema de encontrar todas 
las soluciones de una ecuación diferencial lineal homogénea de coeficien- 
tes constantes de orden n al problema de encontrar el fonjunto de n solu- 
ciones linealmente independientes de la ecuación. Por los resultados del 
Capítulo 1, cualquier conjunto tal debe ser una base para el espacio solu- 
ción. El teorema siguiente nos permite encontrar rápidamente una base 
para muchas de estas ecuaciones. En los ejercicios se dan algunas sugeren- 
cias para su demostración. 


Teorema 2.37. Dados n números complejos distintos C,, Cz, ... , Cn, el conjun- 
to de funciones exponenciales {e%t, et, ... , ent) es linealmente inde- 
pendiente. 


Corolario. Para cualquier ecuación diferencial lineal homogénea con coeficientes 


constantes de orden n, si su polinomio auxiliar p(t) tiene n ceros distintos 
Ci, Ca.. ., Cn, entonces el conjunto [ent, ent, ... , et} es una base para 
el espacio solución de la ecuación. 


DEMOSTRACIÓN. Ejercicio. 


Ejemplo 41. Encontremos todas las soluciones a la ecuación diferencial 
y” + 5y' + 4y = 0. 


Como el polinomio auxiliar p(t) se puede factorizar como (1+ 4)(t +1), 
p(t) tiene dos ceros distintos: —1 y —4. Entonces, (e”*, e*') es una base 
para el espacio solución, y entonces cualquier solución para la ecuación 
dada es de la forma 


y(t) = biet + bae“ para algunas constantes b, y bəz. 


Ejemplo 42. Encontremos todas las soluciones para la ecuación dife- 
rencial 


y” + 9y =0. 
El polinomio auxiliar p(t) = ° +9 puede factorizarse como p(t) = 
(t — 30) (1 + 3i) y por lo tanto tiene ceros distintos cı = 31, cz = —3i. 


Así, {e*t, eit} es una base para el espacio solución. Una base de mucho 
mayor utilidad podría obtenerse aplicando el Ejercicio 7. Como 


1 ; ; 
cos 31 = Set + ett) y sen 3= e — et), 
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se deduce que (cos 31, sen 31) también es una base. Esta base tiene la 
ventaja sobre la original de que consiste de las conocidas funciones seno 
y coseno y no hace referencia al número imaginario i. 


Ahora considérese la ecuación diferencial 
y” Ly +y=0, 


para la cual el polinomio auxiliar es p(t) = (t + 1)?. Por el Teorema 
2.35, et es una solución a la ecuación anterior. Por el corolario del 
Teorema 2.36 su espacio solución es bidimensional. Con el objeto de 
encontrar una base para el espacio solución, necesitamos encontrar una 
solución que sea linealmente independiente de e*. El lector podrá veri- 
ficar que fe-* cumple con esta condición y entonces (e”*, te*} es una base 
para el espacio solución. Este resultado puede generalizarse de la siguien- 
te manera. 


Teorema 2.38. Sea p(t) = (t — c)", donde c es un número complejo y n es 
un entero positivo, el polinomio auxiliar de una ecuación diferencial lineal 
homogénea con coeficientes constantes. El conjunto 


B= {ettet ang e 
es una base para el espacio solución. 


DEMOSTRACIÓN. Como el espacio solución es n-dimensional necesitamos 
únicamente demostrar que 8 es linealmente independiente y que está en el 
espacio solución. Primero obsérvese que para cualquier entero positivo k 


(D — cl) (čet) = kiet + cřet — cfe" 
= ket. 
Por lo tanto, para k < n, 
(D — cl)" (fet) = 0. 


Y se tiene que 8 es un subconjunto del espacio solución. 
Ahora demostraremos que £ es linealmente independiente. Considérese 
cualquier combinación de 8 tal que 


bimet + baet +... + baitet + bre = 0 (8) 

para algunos escalares b,, ... , b,. Dividiendo la ecuación (8) por e**, 
obtenemos 

ba + ba +... + bart T bn =0. (9) 


Por lo tanto, el lado izquierdo de la ecuación (9) debe ser la función poli- 
nomial cero, de donde concluimos que los coeficientes b,, bz, ... , bn son 
todos cero. Luego, 8 es linealmente independiente y por lo tanto es una 
base para el espacio solución. W 
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Ejemplo 43. Dada la ecuación diferencial 
deseamos encontrar una base para el espacio de soluciones. Como su 


polinomio auxiliar es i 


p(t) = 4-4 + 6f — 41+ 1 = (t-— 1), 


podemos concluir por el Teorema 2.38 que (e*, te!, 1?e*, et) es una base 
para el espacio de soluciones, de manera que cualquier solución a la ecua- 
ción dada es de la forma 


y(t) = bæ + bate + b.et + b,et 


para algunos escalares b,, bz, b; y b,. 


La situación más general (cuya demostración dejamos como ejercicio) 
puede enunciarse de la siguiente manera. 


Teorema 2.39. Para una ecuación diferencial lineal con coeficientes constantes 
cuyo polinomio auxiliar es 


p(t) = (t — c )™(t — c)® ... (t — C) ™, 


donde N;,, M2, ... , Dy son enteros positivos y C,, Co, ... , Cy SON números 
complejos distintos, el siguiente conjunto es una base para el espacio solu- 
ción de la ecuación: 


[erit, teet, ... , Prlent,,,. , et, tet, ,,, , fiert}, 


Ejemplo 44. Considérese la ecuación diferencial 
ya = 4y) + Sy — 2y = 0. 


Encontraremos una base para su espacio solución. Como el polinomio au- 
xiliar p(t) puede factorizarse como 


p(t) = £— 48 + 5t- 2 = (t— 1)*(1— 2), 


concluimos que el espacio solución de la ecuación diferencial anterior tiene 
como base 


let, tet, et}. 
Por ello cualquier solución a la ecuación dada es de la forma 
y(t) = byet + b,tet + b,et 


para algunos escalares b,, b: y bs. 
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EJERCICIOS 
1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) El conjunto de soluciones de una ecuación diferencial lineal homogé- 
nea de orden n con coeficientes constantes es un subespacio n-dimen- 
sional de C”. 

(b) El espacio de soluciones de una ecuación diferencial lineal homogénea 
es el espacio nulo de un operador diferencial. 

(c) El polinomio auxiliar de una ecuación diferencial lineal homogénea 
con coeficientes constantes es una solución a la ecuación diferencial. 

(d) Cualquier solución a una ecuación diferencial lineal homogénea con 
coeficientes constantes es de la forma ae”? o afet donde a y c son 
números complejos y k es un entero positivo. 

(e) Cualquier combinación lineal de soluciones a una ecuación diferen- 
cial lineal homogénea con coeficientes constantes es también una 
solución a la ecuación dada. 

(f) Para cualquier ecuación diferencial lineal homogénea con coeficien- 
tes constantes que tenga un polinomio auxiliar p(t), si Ci, C2, ... , Ck 
son las distintas raíces de p(t), entonces (ett, ect, .., , ett) es una 
base para el espacio de soluciones de la ecuación diferencial dada. 

(g) Dado cualquier polinomio p(t) €P(C), existe una ecuación diferen- 


cial lineal homogénea con coeficientes constantes cuyo polinomio au- 
xiliar es p(t). 


Para cada uno de los incisos siguientes, determinar si el enunciado es verda- 
dero o falso. Justificar la respuesta con una demostración o en su caso con 
un contraejemplo. 

(a) Cualquier subespacio dimensionalmente finito de C” es el espacio 
solución de una ecuación diferencial lineal homogénea con coeficien- 
tes constantes. 

(b) Existe una ecuación diferencial lineal homogénea con coeficientes cons- 
tantes cuyo espacio solución tiene como base a (t, £}. 

Tc) Para cualquier ecuación diferencial lineal homogénea con coeficientes 
constantes, si x es una solución, también lo será su derivada x. 
Dados dos polinomios p(t) y g(t) en P(C), si xEN(p(D)) y yEN(q(D)) 

entonces 

(d) x+ y EN(p(D)g(D)). 

(e) xyEN(p(D)q(D)). 

Encontrar bases para los espacios de soluciones de las siguientes ecuaciones 


diferenciales. 


10. 


11. 
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(a) y" +2y+y=0 

b) y"=y 

(c) y -2y4Y+y=0 

(d) y"+2Y+y=0 

(e) y —y0 + 3yW0+5y=0 


Encontrar bases para los siguientes subespacios de C”. 


(a) N(D? — D-— 1) 
(b) N(D* — 3D? + 3D — 1) 
(c) N(D3 + 6D? + 8D) 


Demostrar que C” es un subespacio de F(R, C). 


(a) Probar que D: C”? > C?” es una transformación lineal. 
(b) Probar que cualquier operador diferencial es una transformación li- 
neal en C”. 


Demostrar que si {x, y} es una base para un espacio vectorial sobre C, 
entonces también lo es 


1 1 
—(x + Mir O — a 
{zet 4») 
Dada una ecuación diferencial lineal homogénea con coeficientes constantes 
de segundo orden, supóngase que el polinomio auxiliar tiene raíces complejas 


conjugadas a + ib y a — ib, donde a, b €R. Demostrar que (e** cos bt, 
e** sen bt) es una base para el espacio solución. 


Dada una colección de transformaciones lineales conmutativas por parejas 
(U,, Uz, ... , Un} de un espacio vectorial V (es decir, transformaciones tales 
que U¿U; = U;U; para toda i, j), probar que para cualquier i = 1,2, ...,n. 


N(U;) C N(U,Uz .. .Un). 


Demostrar el Teorema 2.37 y su corolario. Sugerencia: Suponer que 
bet + bæt + ... + b,et = 0 (donde los c; son distintos). 


Para demostrar que los b; son cero, aplicar inducción matemática sobre n. 
Verificar el teorema para n = 1. Suponiendo que el teorema es cierto para 
cualquier n — 1 funciones, aplicar el operador D — c,l a ambos lados de 
la ecuación anterior para establecer el teorema para n diferentes funciones 
exponenciales. 


Demostrar el Teorema 2.39. Sugerencia: Primero verifíquese que la base 
supuesta se encuentra en el espacio solución. Luego verifíquese que este 
conjunto es linealmente independiente por inducción matemática sobre k. 
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El caso k = 1 es el Teorema 2.38. Suponiendo que el teorema se cumple 
para k — 1 c; diferentes, aplíquese el operador (D — cl)" a cualquier 
combinación lineal de la base supuesta que sea igual a cero. 

> 


Sea V el espacio de soluciones de una ecuación diferencial lineal homogé- 
nea de orden n con coeficientes constantes, cuyo polinomio auxiliar es p(t). 
Demostrar que si p(t) = g(1)k(t), donde g(t) y h(t) son polinomios de 
grado positivo, entonces 


N(A(D)) = R(g(Dy)) = g(D) (V), 


donde Dy: V — V está definida mediante Dy(x) = x' para x€ V. Sugeren- 
cia: Demostrar primero que g(D)(V) C N(A(D)). Entonces, probar que 
los dos espacios tienen la misma dimensión finita. 


Una ecuación diferencial 
I Panay paa tay O ay a 


se denomina ecuación diferencial lineal ro homogénea con coeficientes cons- 
tantes si los coeficientes a; son constantes y el lado derecho de la ecuación, 
x, es una función que no es idénticamente nula. 


(a) Demostrar que para: cualquier x €C” existe una y€C” tal que y es 
una solución para la ecuación anterior. Sugerencia: Utilizar el Le- 
ma 1 del Teorema 2.36 para demostrar que si 


PU) 5 # + ant +... +at+ a, 


entonces p(D): C” — C” es sobreyectiva. 
(b) Sea V el espacio de soluciones para la ecuación lineal homogénea 


sa E a A SN 


Demostrar que si z es cualquier solución a la ecuación diferencial li- 
neal no homogénea anterior, entonces el conjunto de todas las solu- 
ciones a la ecuación diferencial lineal no homogénea es 


{z +y: yEV}. 


Dada cualquier ecuación diferencial lineal no homogénea de orden n con 
coeficientes constantes, demostrar que para cualquier solución x y cualquier 
b ER si x(t) = x (to) =... = x(t) = 0, entonces x = 0 (la fun- 
ción cero). Sugerencia: Emplear inducción matemática sobre n. Primero 
demostrar la conclusión para el caso n = 1. Luego, supóngase que es cierto 
para ecuaciones de orden n — 1 y considérese una ecuación de orden n 
con polinomio auxiliar p(t). Descomponer p(t) como pO =qa0GU-—c) 
para algún número complejo c y un polinomio q(t) de grado n — 1. Sea 
z = q(D)x. Demostrar que z(t) =0 y que z es una solución para la 


ecuación y” — cy = 0. Concluir que z = 0. Ahora aplíquese la hipótesis de 
inducción. 


15. 


16. 
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Sea V el espacio solución de una ecuación diferencial lineal homogénea de 
orden n con coeficientes constantes. Fijar ft. €R y definir un mapeo 6: 
V => C por 
de 
x(to) 
x'(to) 


®(x) = í para cada x e€ V. 


x”t 1 (to) 


(a) Demostrar que $ es lineal y que su espacio nulo es trivial. Deducir 
que $ es un isomorfismo. Sugerencia: Usar el Ejercicio 14. 

(b) Demostrar lo siguiente: Para cualquier ecuación diferencial lineal ho- 
mogénea de orden n con coeficientes constantes, cualquier LER y 


cualesquiera números complejos Co, C,, ... , Cn-ı (no necesariamente 
distintos), existe exactamente una solución, x, a la ecuación diferen- 
cial dada tal que xP (t) = c parak=0,1,...,n-— 1. 


Movimiento pendular. Es bien sabido que el movimiento de un péndulo se 
puede representar por la ecuación diferencial 


gr +54 =0, 


donde 0(t) es el ángulo en radianes que el péndulo forma con una línea 
vertical en el tiempo t (ver Fig. 2.6) interpretado de tal modo que 4 sea 
positivo si el péndulo está a la derecha y negativo si el péndulo está a la 
izquierda de la línea vertical, desde el punto de vista del lector. En este 


D 


figura 2.6 


caso l es la longitud del péndulo y g es la magnitud de la aceleración debi- 
da a la gravedad. La variable £ y las constantes / y g deben estar expresadas 
en unidades compatibles, por ejemplo, £ en segundos, ! en metros y g en 
metros por segundo por segundo. 


(a) Expresar una solución arbitraria a esta ecuación como una combina- 
ción lineal de dos funciones reales fijas. 
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(b) Encontrar la solución única de la ecuación que satisface las condi- 
ciones 


9(0)=0,.>0 y 9'(0) =0. 


(El significado de lo anterior es que en un tiempo t= O el péndulo está 
desplazado de la posición vertical 0, radianes y tiene una velocidad cero.) 


(c) Demostrar que al péndulo le toma 27 y+ unidades de tiempo 


para completar un recorrido completo de ida y vuelta. (Este lapso 
se denomina período del péndulo.) 


Movimiento Periódico de un Resorte con Amortiguamiento. Al principio 
de esta sección discutimos el movimiento de un resorte que oscila bajo la 
suposición de que la única fuerza que actuaba sobre el resorte era la fuerza 
debida a la tensión del mismo. Encontramos en este caso que la ecuación 
(3) describía el movimiento del resorte. 


(a) Encontrar la forma general de todas las soluciones de la ecuación (3). 


Si analizamos el comportamiento de la solución general del inciso (a), ve- 
mos que la solución es una función periódica. Por tanto la ecuación (3) 
indica que el resorte nunca cesará de oscilar. Sin embargo, sabemos por ex- 
periencia, que la amplitud de la oscilación decrece hasta que finalmente 
el movimiento cesa. La razón por la cual la solución del inciso (a) no expli- 
ca este comportamiento es que hemos ignorado el efecto de la fricción sobre 
el peso en movimiento. A bajas velocidades, tales como la que se está 
considerando, la resistencia del aire proporciona un ejemplo de amortigua- 
miento viscoso —la resistencia es proporcional a la velocidad del peso en 
movimiento pero en dirección opuesta. Para hacer una corrección a causa 
de la resistencia del aire, debemos añadir a la ecuación (2) el término —ry”. 
La constante r > 0 depende del medio en el cual ocurre el movimiento 
(en este caso el aire), y el término —ry” tiene un signo negativo debido a 
que la resistencia tiene siempre sentido opuesto al del movimiento. Luego 
entonces, la ecuación diferencial del movimiento es my” = —ry! — ky; es 
decir, 
my" + ry + ky=0. 
(b) Encontrar la solución general de esta ecuación. 
(c) Encontrar la solución única del inciso (b) que satisface las condi- 
ciones iniciales y(0) = 0 y y'(0) = vo. 
(d) Para y(t) del inciso (c), demostrar que la amplitud de la oscilación 
decrece hasta llegar a cero; o.sea, demostrar que 
lim y(t) =0. 


t>30 


Al principio de esta sección se enunció que es útil considerar las solucio- 
nes de las ecuaciones diferenciales como funciones complejas de variable 
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real, aun cuando las soluciones que para nosotros tienen significado en el 
sentido físico son funciones reales. Justificar este punto de vista. 


v 
19. El siguiente conjunto de ejercicios no implican el uso de álgebra lineal; 
los enunciamos sólo para completar un poco más el tema. 


(a) Demostrar el Teorema 2.31. Sugerencia: Utilizar inducción matemá- 
tica sobre el número de derivadas que tiene una solución. 
(b) Demostrar (i) e = ee. 


(ii) e= A para c, d EC. 


(c) Demostrar el Teorema 2.33. 

(d) Verificar la regla del producto de la diferenciación para funciones 
complejas de variable real: Para cualquier par de funciones diferen- 
ciables x y y en F(R, C) el producto xy es diferenciable y 


(xy)! = xy + xy. 


Sugerencia: Encontrar las partes reales e imaginarias de xy en tér- 
minos de las x y las de y, luego proceder con la diferenciación. 

(e) Demostrar que si x€ F(R, C) y x' = 0, entonces x es una función 
constante. 
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Capítulo 3 


Operaciones elementales 
en matrices y sistemas de 
ecuaciones lineales 


Este capítulo está dedicado al logro de dos objetivos relacionados entre 
SÍ: 


1. El estudio de algunas operaciones “que conservan el rango” en 
las matrices. 

2. La aplicación de estas operaciones y de la teoría de las transfor- 
maciones lineales a la solución de sistemas de ecuaciones lineales. 


Como una consecuencia del primer objetivo obtendremos un método sen- 
cillc para calcular el rango de una transformación lineal entre espacios 
vectoriales dimensionalmente finitos, aplicando las operaciones que con- 
servan el rango a una matriz que representa dicha transformación. 

La solución de sistemas de ecuaciones lineales es probablemente la 
aplicación más importante del álgebra lineal. El conocido método de eli- 
minación para resolver sistemas de ecuaciones lineales, que fue discutido 
en la Sección 1.4, implica la eliminación de variables de manera que se 
pueda obtener un sistema más sencillo. Esta técnica por medio de la cual 
se eliminan las variables utiliza tres tipos de operaciones: 


1. Intercambio de dos ecuaciones cualesquiera del sistema. 
Multiplicación de cualquier ecuación del sistema por una constan- 
te no nula. 

3. Suma de un múltiplo de una ecuación a otra ecuación. 


Veremos en la Sección 3.3 que un sistema de ecuaciones lineales puede 
ser expresado como una ecuación matricial sencilla. En esta representación 
del sistema las tres operaciones mencionadas anteriormente son las “ope- 
raciones elementales con los renglones” en las matrices. Estas Operacio- 
nes proporcionarán un método de cálculo conveniente para determinar 
todas las soluciones de un sistema de ecuaciones lineales. 
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OPERACIONES ELEMENTALES EN MATRICES 
Y MATRICES ELEMENTALES 


En esta sección definiremos las operaciones elementales para matrices que 
serán empleadas a lo largo de este capítulo. En las secciones subsecuentes 
estas operaciones serán utilizadas para obtener métodos sencillos de cálcu- 
lo, para determinar el rango de una transformación lineal y las soluciones 
de un sistema de ecuaciones lineales. Existen dos tipos de operaciones ma- 
triciales elementales —operaciones sobre los renglones y operaciones sobre 
las columnas. Como veremos a continuación, las operaciones con los 
renglones son de mayor utilidad. Estas operaciones surgen de las tres ope- 
raciones que se pueden emplear para eliminar variables en un sistema de 
ecuaciones lineales. 

Sea A una matriz de m x n en un campo F. Recuérdese que A puede 
considerarse como un arreglo de m renglones, 


A, 
Á, 
A=|" 
Am 
o como un arreglo de n columnas, A = (A1, A?,... , A”). 


Definiciones. Sea A una matriz de m x n, como la anterior. Cualquiera de las 


tres operaciones siguientes sobre los renglones [columnas] de A se deno- 
mina operación elemental sobre los renglones [columnas]. 


(a) Intercambio de dos renglones [columnas] cualesquiera de A. 

(b) Multiplicación de cualquier renglón [columna] de A por una 
constante no nula. 

(c) Suma de cualquier múltiplo constante de un renglón [columna] 
de A a otro renglón [columna]. 


Cualquiera de las tres operaciones anteriores se denominará operaciór 
elemental. 


Las operaciones elementales serán tipo 1, tipo 2 o tipo 3, dependiendo de 
si se trata de (a), (b) o (c). 


Ejemplo 1. Sea 


1 2 3 4 
A=|2 1 —1 3 
4 0 1 2 
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El intercambio de Az, el segundo renglón de 4, con A,, el primer 
renglón de A, es un ejemplo de una operación elemental de tipo 1 sobre 
los renglones. La matriz resultante es 


2 1 = 3 
B=|1 2 3 4] 
4 0 1 2 


Así también, la multiplicación de A?, la segunda columna de A, por 
3 es un ejemplo de una operación elemental sobre las columnas del tipo 2. 
La matriz resultante es 


11.6 314 
C=|2 3 —1 3 
4 0 1 2 


Por último, la suma de A,, el primer renglón de A, de cuatro veces 
A, el tercer renglón de A, es un ejemplo de una operación elemental con 
renglones del tipo 3. La matriz resultante es 


17 2 7 12 
D=| 2 1 —1 3] 
4 0 1 2 


Definición. Una matriz elemental de n x n es una matriz obtenida al realizar 
una operación elemental en I„. Se dice que la matriz es del tipo 1, 2, o 3 
dependiendo de que la operación realizada en 1, haya sido del tipo 1l, 
2 o 3, respectivamente. 


Por ejemplo, el intercambio de los dos primeros renglones de I, pro- 
duce la matriz elemental 
0 10 
E=|1 0 0]. 
0.01 
Nótese que E también se puede obtener mediante el intercambio de las 
dos primeras columnas de 7;. De hecho, cualquier matriz elemental puede 
ser obtenida al menos de dos maneras —ya sea realizando una operación 
elemental con renglones en /, o realizando una operación elemental con 
columnas en /,. De igual manera 


1 0 —2 
O 1 0 
0 0 1 


es una matriz elemental, ya que puede obtenerse a partir de I, mediante 
una operación elemental con columnas del tipo 3 (añadiendo —2 veces 
la primera columna de I; a la tercera) o mediante una operación elemen- 
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tal con renglones del tipo 3 (añadiendo —2 veces el tercer renglón al 
primero). 

Nuestro primer teorema muestra que realizar una operación elemental 
en una matriz es equivalente a multiplicar la matriz por una matriz ele- 
mental. 


Teorema 3.1. Sea AEMmin(F), y supóngase que B se obtiene a partir de A 
al realizar una operación elemental con renglones [columnas]. Entonces 
existirá una matriz elemental E de m x m [n x n] tal que B = EA[B = 
AE]. De hecho, E se obtiene al realizar la operación correspondiente con 
renglones [columnas] en 1,,[1,]. Recíprocamente, si E es una matriz elemen- 
tal de m x mín x n], entonces EA[AE] es una matriz que se puede obte- 
ner realizando una operación elemental con renglones [columnas] en A. 


Antes de considerar una demostración, consideraremos primero un 
ejemplo para ilustrar el significado del teorema. 


Ejemplo 2. Considérese la matriz B del Ejemplo 1. Esta matriz fue ob- 
tenida a partir de 4 (en el Ejemplo 1) intercambiando los dos primeros 
renglones de 4. Realizando esta misma operación en /.. obtenemos la 


matriz elemental 


0 0 


l 
E = 0 0j. 
O 1 
Nótese que EA = B. 
En la segunda parte del Ejemplo 1, C se obtiene a partir de A multi- 


plicando la segunda columna de A por 3. Realizando esta misma operación 
en /,, obtenemos la matriz elemental 


1000 
E-[9 300 
0010 
0 0 0 1 


Obsérvese que AE = C. 


DEMOSTRACIÓN DEL TEOREMA 3.1. Supóngase que B se obtiene a partir 
de A mediante una operación elemental. Debemos considerar seis casos, 
una por cada tipo de operación con renglones y una por cada tipo de 
operación con columnas. 

Supóngase que B se obtiene intercambiando los renglones p y q de 
A(p < q) mediante una operación elemental del tipo 1. Entonces 


(a) Bi; =A; para i Æp e iÆ+q, y j=1,2,..., A. 
(b) Bp =A; para j= 1, 2,..., M 
(c) Ba = Apj para j= 1, 2,..., A. 
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Sea E la matriz elemental de m x m obtenida a partir de Im intercambian- 
do los renglones p y q de Im. Entonces para ip e iq y para toda 
JA <]<m): 


E; =0 si i Æj 
E 1 


ij Z si i=j. 
Para i= p, 
E p =0 si jÆqąq 
En = 1. 
Para ¡= q, 
Ej =0 si j4p 
Em = 1 
Puesto que 


(EA); = X Erri 
k=1 


para toda j se tiene que 
(EA); = E; 
(EA); = E 
(EA )aj 


¡Aj Aj sii#poqą, 
mÁg = Agj» 
Emp Api = Apj» 


ll 


De aquí que 
Bi; = (EA);; para toda į y toda j. 


Esto establece el caso 1. 

Si B se obtiene a partir de Æ mediante una operación elemental con 
renglones del tipo 2 o 3, entonces la demostración es semejante y podrá 
realizarse como ejercicio. 

Ahora supóngase que B se obtiene a partir de A realizando una ope- 
ración elemental con las columnas de A. Entonces, por el Ejercicio 5, Bt 
se puede obtener a partir de A* mediante las correspondientes operaciones 
elementales con renglones de A. Entonces, las partes anteriores de la de- 
mostración muestran que la matriz elemental M de n x n obtenida al 
realizar el mismo tipo de operación con renglones en /, tiene la propiedad 
de que Bf = MA*. Obsérvese que E = M’ es una matriz elemental que 
puede obtenerse realizando las operaciones elementales correspondientes 
con columnas en /,. Entonces, B = (Bt)! = (MA)! = AM! = AE, esta- 
bleciendo el mismo resultado para operaciones con columnas. 

La demostración de la proposición recíproca se deja como ejercicio. MW 


Es un hecho de gran utilidad el que la inversa de una matriz elemental 
es también una matriz elemental. 
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Teorema 3.2. Las matrices elementales son invertibles y la inversa de una 
matriz elemental es una matriz elemental del mismo tipo. 


DEMOSTRACIÓN. En vista del hecho de que cualquier matriz elemental de 
n x n puede obtenerse mediante operaciones elementales con renglones 
en /,, sólo necesitamos considerar tres casos —uno por cada tipo de ope- 
ración. 

Sea E una matriz elemental de n x n. 


Caso 1. Supóngase que E se obtiene intercambiando los renglones p y 
q de I.(p + q), una operación elemental del tipo 1. Resulta fácil verificar 
que E? = I„. Por lo tanto, E es invertible y, de hecho, E = E. Esto esta- 
blece el primer caso. 


Caso 2. Supóngase que E se obtiene multiplicando el renglón p de In 
por una constante c no nula, una operación elemental del tipo 2. Como 
cÆ 0, c tiene un inverso multiplicativo. Sea E la matriz elemental obte- 
nida a partir de Z, multiplicando el renglón p de 1, por c”*. Puede demos- 


trarse fácilmente que EE = EE = I,. Esto establece el segundo caso. 


Caso 3. Supóngase que E se obtiene sumando al renglón p de 1, c veces 
el renglón q de /,,, donde p 4 q y c es cualquier escalar. Entonces E puede 
obtenerse a partir de /, mediante una operación elemental del tipo 3. 
Obsérvese que /, puede obtenerse a partir de E mediante una opera- 
ción elemental con renglones del tipo 3 —a saber, sumando al renglón p 
de E - c veces el renglón q de E. Por el Teorema 3.1 se tiene que existe 


una matriz elemental E (del tipo 3) tal que EE = 1,, y por el Ejercicio 8 
de la Sección 2.4 E es invertible y E? = E. MW 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Una matriz elemental siempre es cuadrada. 

(b) Los únicos elementos de una matriz elemental son ceros y unos. 

(c) La matriz identidad de n x n es una matriz elemental. 

(d) El producto de dos matrices elementales de n x n es una matriz 
elemental. 

(e) La matriz inversa de una matriz elemental es una matriz elemental. 

(f) La suma de dos matrices elementales de n x n es una matriz ele- 
mental. 

(g) La transpuesta de una matriz elemental es una matriz elemental. 

(h) Si B es una matriz que se puede obtener realizando una operación 
elemental con renglones en una matriz A, entonces B también puede 
obtenerse realizando una operación elemental con columnas en 4. 


10. 


11. 
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(i) Si B es una matriz que se puede obtener realizando una operación 
elemental con renglones en una matriz A, entonces A se puede obte- 
ner realizando una operación elemental con renglones en B. 


Sean 


1 2 3 1 0 3 1 0 3 
A=|1 0 1), B=|1 -2 1], y C=|0 -2 -2 
L =i 1 I =3 1 1 -3 1 


Encontrar una operación elemental que permita transformar a A en B y 
otra que transforme a B en C. Por medio de varias operaciones elementales 
adicionales transformar a C en I. 


Demostrar la aseveración hecha en la página 141. Una matriz elemental de 
n x n puede obtenerse al menos de dos maneras —ya sea realizando una 
operación elemental con renglones en /, o realizando una operación ele- 
mental con columnas en Iņ. 


Demostrar que E es una matriz elemental si y sólo si E* lo es. 


Sea A una matriz de m x n. Demostrar que si B puede obtenerse a partir 
de A mediante una operación elemental con renglones [columnas], enton- 
ces Bt puede obtenerse a partir de A* mediante la operación elemental 
correspondiente con renglones [columnas]. 


Completar la demostración del Teorema 3.1. 


Verificar la aseveración hecha en el Caso 1 de la demostración del Teore- 
ma 3.2: Si E es una matriz elemental de n x n del tipo 1, entonces E? = In. 


Verificar que para la matriz E definida en la demostración del Caso 2 del 
Teorema 3.2 EE = EE = h. 


Demostrar que cualquier operación elemental con renglones [columnas] del 
tipo 1 puede obtenerse mediante una sucesión de tres operaciones elemen- 
tales con renglones [columnas] del tipo 3 seguida por una operación ele- 
mental con renglones [columnas] del tipo 2. 


Demostrar que cualquier operación con renglones [columnas] del tipo 2 pue- 
de obtenerse dividiendo algún renglón [columna] por un escalar no nulo. 


Demostrar que cualquier operación elemental con renglones [columnas] del 
tipo 3 puede obtenerse restando un múltiplo de algún renglón [columna] 
de otro renglón [columna]. 
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3.2 EL RANGO DE UNA MATRIZ Y LA INVERSA DE UNA MATRIZ 


En esta sección definiremos el rango de una matriz, y utilizaremos enton- 
ces las operaciones elementales para calcular el rango de una matriz o 
de una transformación lineal. La sección concluirá con un procedimiento 
para calcular la inversa de una matriz invertible. 


Definición. Si A € Mmxn(F), definimos el rango de A, que escribiremos ran- 
go(A), como el rango de la transformación lineal L,: F" > Fn. 


Un gran número de resultados sobre el rango de las matrices se deriva 
de inmediato a partir de los hechos correspondientes sobre las transfor- 
maciones lineales. Un resultado importante de este tipo, que se deriva del 
Teorema 2.20 y del Corolario 2 del Teorema 2.21, es que una matriz de 
n x n es invertible si y sólo si su rango es n. 


Nos gustaría que la definición anterior satisficiera la condición de que 
el rango de una transformación lineal fuese igual al rango de cualquier 
matriz que represente dicha transformación. Nuestro primer teorema mues- 
tra que, de hecho, esta condición se satisface. 


Teorema 3.3. Sea T: V-—>W una transformación. lineal entre espacios vecto- 
riales dimensionalmente finitos y sean B y y bases ordenadas para NV y 
W, respectivamente. Entonces, rango(T) = rango([T];). 


DEMOSTRACIÓN. Esta es sólo una manera de reenunciar el Ejercicio 18 
de la Sección 2.4. MW 


Corolario 1. Sea A una matriz de m x n. Si P y Q son respectivamente ma- 
trices invertibles de m x m y n x n, entonces rango(PAQ) = rango(A). 
En particular rango(PA) = rango(AQ) = rango(A). 


DEMOSTRACIÓN. Sea B = PAQ. En virtud del Ejercicio 12 de la Sección 
2.5, existen espacios vectoriales V y W, bases 8, 8” para V y y, y' para 
W y una transformación lineal T: W—>W tal que A = MT y B= [TTz. 
Entonces por el Teorema 3.3 


rango (PAQ) = rango(B) = rango(T) = rango(4). E 


Corolario 2. Las operaciones elementales con renglones y columnas en una 
matriz conservan el rango. 


DEMOSTRACIÓN. Si la matriz B se obtiene a partir de la matriz A me- 
diante una operación elemental con renglones, entonces existe una matriz 
elemental E tal que B = EA. De acuerdo con el Teorema 3.2, E es 
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invertible y por tanto rango(B) = rango(A) por el Corolario 1. Por lo 
tanto, las operaciones elementales con renglones conservan el rango. La 
demostración de que las operaciones elementales con columnas no alteran 
el rango se deja como ejercicio. W 


El Teorema 3.3 relaciona íntimamente el rango de una transformación 
lineal con el rango de una matriz. Como las matrices son herramientas 
útiles para estudiar las transformaciones lineales, es importante desarrollar 
un método para calcular el rango de una matriz. Esta será nuestra siguien- 
te tarea. 


Teorema 3.4. El rango de cualquier matriz es igual al máximo número de co- 
lumnas linealmente independientes de dicha matriz; esto es, el rango de 
una matriz es la dimensión del subespacio generado por las columnas 
de dicha matriz. 


DEMOSTRACIÓN. Para toda A € Mmin(F), 


rango(A) = rango(L1) = dim(R(L,)). 


Sea B = ([€,, €z, ... , €n}, la base ordenada estándar para F". Entonces 8 
genera a F” y entonces 


R(La) = Lífla(er), Lalez), ... , Lalen)). 
Pero hemos visto que L¿(e,) = A?, la columna j-ésima de A. Por lo tanto 
R(La) = L(41,43,...,4"). 
Entonces 


rango(4) = dim(R(L4)) = dim(L(4?!, A?,..., A"). E 


Ejemplo 3. Sea 
l 


1 0 
A=|0 1 1] 
1 O 1 


Obsérvese que la primera y la segunda columnas de A son linealmente 
independientes y que la tercera columna es una combinación lineal de las 
dos primeras. Entonces 


I 0 1 
rango(4) = dim| L 40], [1], 1! =P 
1 0 l 


Para calcular el rango de una matriz A, a menudo es útil posponer 
el empleo del Teorema 3.4 hasta que 4 se haya modificado adecuada- 
mente por medio de operaciones elementales con renglones y columnas de 
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tal manera que el número de columnas linealmente independientes sea 
evidente. El Corolario 2 del Teorema 3.3 garantiza que el rango de la 
matriz modificada es el mismo que el rango de A. Una de estas modifica- 
ciones de A se puede obtener mediante el uso de operaciones elementales 


` con columnas y renglones hasta introducir elementos nulos. El ejemplo 


siguiente ilustra este procedimiento. 


Ejemplo 4. Sea 
l 2 1 
A=|1 0 3]. 
1 1 2 


Si restamos el primer renglón de A de los renglones 2 y 3 (operaciones 
elementales tipo 3 con renglones), se tiene como resultado 


l 2 1 
0 —2 2j- 
0 —1 1 


Si ahora restamos dos veces la primera columna de la segunda y la prime- 
ra columna de la tercera (operaciones elementales tipo 3 con columnas) 
obtenemos 


1 00 
0 —2 2]- 
0 —1 1 


Es ahora evidente que el número máximo de columnas linealmente inde- 
pendientes de esta matriz es 2. Por lo tanto, el rango de A es 2. 


El siguiente teorema utiliza este proceso de modificación de una matriz 
por medio de operaciones elementales con renglones y columnas para 
transformarla a una forma particularmente simple. La fuerza de este teore- 
ma se puede ver en sus corolarios. 


Teorema 3.5. Sea A una matriz de m x n de rango r. Entonces r < m, r < n, 


y por medio de un número finito de operaciones elementales con renglo- 
nes y columnas A se puede transformar en una matriz D tal que 


(a) D;=0 para i Æj, 
(b) Di =1 para i <r, 
(c) D:=0 para i>r. 


El teorema anterior y sus corolarios son muy importantes. Su demos- 
tración, aunque fácil de entender, es bastante tediosa. Como ayuda para 
seguir la demostración consideraremos primero un ejemplo. 


El rango de una matriz y la inversa de una matriz 149 


Ejemplo 5. Considérese la matriz 


024 22 
4al’ 44 80 
8 2 0 10 2 
6 3 2 9 1 


Por medio de una sucesión de operaciones elementales con renglones y 
columnas transformaremos a A en una matriz D tal como lo establece el 
Teorema 3.5. Escribiremos muchas de las matrices intermedias, pero en 
algunas ocasiones transformaremos una matriz a partir de la anterior me- 
diante varias operaciones elementales simultáneas. El número sobre la 
flecha indicará cuántas operaciones se han involucrado; trátese de iden- 
tificar la naturaleza de cada operación (si se hizo sobre un renglón o 
sobre una columna y el tipo de operación). 


024 22 444 3830 l11.20 
444 801 |, [0 24 22] | 1024 22], 

— —> — 
8 2 0 10 2 8 2 0 10 2 8 2 0 10 2 
6 32 9 1 632 9 m1 6 3 2 9 1 
1 1 1 2 0 1 0 0 0 0 
0 2 4 2 2| , |0 2 4 PASA 

—> e 
0 —6 -8 —6 2 0 —6 -8 -6 2 
O —3 -4 —3 1 0 —3 —4 -3 1 
1 0 0 0 0 10000 10000 
0 1 2 lj2 {0 1 2 1 i|, [O 1 O O OJ, 
= —> —> 

0 —6 -8 -6 2 00408 0040 8 
0 —3 —4 —3 1 00204 0020 4 
10000 10000 10000 
01000], 10 1000|, [00 1000 

— —> = D. 
0 O 1 0 2 0 0 I 0 2 00100 
00204 00000 00000 


En virtud del Corolario 2 del Teorema 3.3, rango(4) = rango(D), pero 
es evidente que rango(D) = 3; así rango(A) = 3. Nótese que las dos 
primeras operaciones elementales dan como resultado un 1 en la posición 
1, 1 y las siguientes operaciones (tipo 3) dan como resultado ceros, en 
todas las posiciones del primer renglón y primera columna a excepción de 
la posición 1, 1. Las operaciones elementales subsecuentes no producen 
cambios en el primer renglón ni en la primera columna. Con este ejem- 
plo en mente procederemos a la demostración. 
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DEMOSTRACIÓN DEL TEOREMA 3.5. Si A es una matriz nula, r= 0 por 
el Ejercicio 3. En este caso se concluye que D = A. 


Ahora, supóngase que A -0 y r= rango(4); entonces r > 0. La 
demostración se hará por inducción matemática sobre m, el número de 
renglones de A. 

Supóngase que m = 1. Por medio de a lo más una operación con 
columnas del tipo 1 y una operación con columnas del tipo 2, A puede 
ser transformada en una matriz con un 1 en la posición 1, 1, y por medio 
de a lo más n — 1 operaciones con columnas del tipo 3, esta matriz puede 
ser transformada a su vez en la matriz 


D = (1,0, 0,... 0). 


Nótese que existe un máximo de una columna linealmente independien- 
te en D. Por lo tanto rango(D) = rango(4) = 1 de acuerdo con el Coro- 
lario 2 del Teorema 3.3 y el Teorema 3.4. Por lo tanto, el teorema queda 
establecido para m = 1. 

Ahora supóngase que el teorema se cumple para cualquier matriz con 
un máximo de m — 1 renglones (para algún m > 1). Demostraremos que 
el teorema se cumple para cualquier matriz con m renglones. 

Supóngase que A es cualquier matriz de m x n. Si n = 1, el Teorema 
3.5 se demuestra de una manera análoga que para m = 1. (Véase el 
Ejercicio 10.) 

Supondremos que n > 1. Como 4% O, Ai; 0 para algún i, j. Por 
medio de a lo más una operación con renglones y una operación con 
columnas (ambas del tipo 1) se puede colocar un elemento no nulo en la 
posición 1, 1 (tal como se hizo en el Ejemplo 5). Por medio de a lo más 
una operación adicional del tipo 2 podemos asegurar un 1 en la posición 
1, 1. (Véase la segunda operación en el Ejemplo 5.) Por medio de un 
máximo de m — 1 operaciones con renglones del tipo 3 y n — 1 opera- 
ciones con columnas del tipo 3 podemos eliminar a todos los elementos 
no nulos del primer renglón y la primera columna, con excepción del 1 
en la posición 1, 1. (En el Ejemplo 5 utilizamos dos operaciones con 
renglones y tres operaciones con columnas para poder alcanzar este estado.) 

Por tanto, con un número finito de operaciones elementales, A puede 
transformarse en una matriz 
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donde B’ es una matriz de (m — 1) x (n — 1). En el Ejemplo 5, 


E AS 
B'=|—6 —8 —6 2]. 
zy g a 


Por el Ejercicio 11, B’ tiene un rango una unidad menor que el de B. 
Como rango(4) = rango(B) = r, rango(B') =r — 1. De acuerdo con 
la hipótesis de inducción r — 1 <n— 1 y r— 1<m-= 1. Por lo tanto, 
r<myr<n. 

También por la hipótesis de inducción, B’ puede transformarse por 
medio de un número finito de operaciones elementales con renglones y 
columnas en una matriz D’ de (m — 1) x (n — 1) tal que 


(D')¡¡=0 si i4j, 
Di: 1 si i< r— 1, 
(DD): ¡=0 si i>r. 


Esto es, que D’ consta totalmente de ceros a excepción de las primeras 
r — 1 posiciones de la diagonal principal que tienen unos. Sea 


Vemos que el teorema se establece una vez que queda demostrado que D 
puede obtenerse de B por medio de un número finito de operaciones ele- 
mentales con renglones y columnas. Pero esto se obtiene aplicando repe- 
tidas veces el Ejercicio 12. 

Así, como A puede ser transformada en B y B puede ser transformada 
en D, ambas mediante un número finito de operaciones elementales, en- 
tonces A puede ser transformada en D mediante un número finito de 
operaciones elementales. 

Finalmente, como D’ contiene unos en las primeras r — 1 posiciones 
sobre la diagonal principal, D contiene unos en las primeras r posicio- 
nes sobre su diagonal principal y ceros en el resto de ellas. Luego entonces, 
D,y=1 sii<r,D, =0sii>r,y Dy =0 si ij. Esto establece el 
teorema. EM 


Corolario 1. Sea A una matriz de m x n de rango r. Entonces existen matrices 
invertibles B y C de dimensiones m x m y n x n, respectivamente, tales 
que D = BAC donde D es una matriz de m x n que satisface 
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(a) Di F 0 si 13], 
(b) Di =1 sii<r, 
(c) D,¡=0 si i>r. 


Il 


DEMOSTRACIÓN. De acuerdo con el Teorema 3.5, A puede ser transfor- 
mada en la matriz D mediante un número finito de operaciones elementales 
con renglones y columnas. Podemos recurrir al Teorema 3.1 cada vez que 
realicemos operaciones elementales. Entonces, existirán matrices elemen- 
tales de m x m E,, E,,..., E, y matrices elementales de n x n G,, 
Gz, ... , G4 tales que 


D = E Epa ... E.E,AG,G, ... Gy. 


De acuerdo con el Teorema 3.2, todas las E; y G; son invertibles. Sean 
B = E,Epı ... Er y C=G,... Ga. Entonces, de acuerdo con el Ejer- 
cicio 2 de la Sección 2.4 B y C son invertibles y D = BAC. MW 


Corolario 2. Sea A una matriz arbitraria de m x n. 


(a) Rango(At) = rango(A). 

(b) El rango de cualquier matriz es igual al número máximo de 
renglones linealmente independientes de dicha matriz; esto es, el 
rango de una matriz es la dimensión del subespacio generado 
por los renglones de la matriz. 

(c) Los renglones y las columnas de cualquier matriz generan sub- 
espacios de la misma dimensión, numéricamente iguales al rango 
de la matriz. 


DEMOSTRACIÓN. 


(a) Por el Corolario 1 existen matrices invertibles B y C tales que 
D = BAC, donde D satisface las condiciones enunciadas en el corolario. 
Tomando las transpuestas tenemos 


D! = C'A'B'. 


Puesto que B y C son invertibles, también lo son B* y C', en virtud del 
Ejercicio 3 de la Sección 2.4. Entonces, por el Corolario 1 del Teore- 


ma 3.3, 
rango(A') = rango(C*4'B*) = rango(D'). 


Supóngase que r = rango(A). Entonces D* es una matriz de n x m 
que satisface las condiciones del Corolario 1 y, por tanto, rango(D'*) =r 
por el Teorema 3.4. Así, 


rango(4*) = rango(D*) = r = rango(4A). 


Esto establece (a). 
Las demostraciones de (b) y (c) se dejan como ejercicios. MM 
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Corolario 3. Cualquier matriz invertible es un producto de matrices elementales. 


DEMOSTRACIÓN. Si A es una matriz invertible de n x n, entonces ran- 
go(A) = n, y entonces por el Corolario 1 existen matrices invertibles B 
y C tales que D = BAC, donde Di; = O para ij y Di=1 para 
1 <i< n. Entonces D = I,; esto es, In = BAC. 


En la demostración del Corolario 1 nótese que B = E,Ep-ı ... E; y 
C = GG: ... G, donde las E, y las G; son matrices elementales. Enton- 


ces A = BI, C* = BC”, y así A= EFEZ... ESG Or . . G71. Pero 
la inversa de una matriz elemental es elemental y por lo tanto A es el 
producto de matrices elementales. Mi 


Utilizaremos al Corolario 2 para relacionar el rango de un producto 
de matrices con el rango de cada factor. Nótese cómo la demostración 
emplea la relación entre el rango de una matriz y el rango de una trans- 
formación lineal. 


Teorema 3.6. Sean T: V>W y U: W>Z transformaciones lineales en es- 


pacios vectoriales dimensionalmente finitos V, W y Z, y sean A y B matrices 
tales que AB está definido. Entonces 


(a) rango(UT) < rango(U) . 

(b) rango(UT) < rango(T) . 

(c) rango(AB)< rango(A) . 

(d) rango(AB) < rango(B) . 
DEMOSTRACIÓN. Claramente se ve que R(T) C W y por lo tanto 

R(UT) = UT(V) = U(R(M) C U(W) = R(U). 
Entonces 
rango(UT) = dim(R(UT)) < dim(R(U)) = rango(U). 


Esto establece el inciso (a). 
De acuerdo con el inciso (a) 


rango(AB) = rango(Las) = rango(Lalg) < rango(L,) = rango(4A). 


Esto establece el inciso (c). 
En virtud del inciso (c) y del Corolario 2 del Teorema 3.5 


rango(AB) = rango((AB)*) = rango(B'A*) < rango(B*) =rango(B). 


Esto establece el inciso (d). 
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Sean a, B y y bases ordenadas para V, W y Z, respectivamente, y sean 
A’ = [UF y B' = mi Entonces A'B’ = [UT]; de acuerdo con el Teore- 
ma 2.12. Por lo tanto, por el Teorema 3.3 y el inciso (d), 


rango(UT) = rango(A4'B') < rango(B') = rango(T). 
Esto establece el inciso (b). W 


Veremos posteriormente que es importante poder calcular el rango de 
cualquier matriz. Podemos emplear el Corolario 2 del Teorema 3.3, los 
Teoremas 3.4 y 3.5 y el Corolario 2 del Teorema 3.5 para llevar a cabo 
nuestro propósito. 

El objetivo es utilizar operaciones elementales con renglones y colum- 
nas en una matriz para “simplificarla” (de tal modo que la matriz trans- 
formada tenga muchos ceros) hasta que una observación sencilla nos 
permita determinar cuántos renglones o columnas linealmente indepen- 
dientes tiene la matriz y así determinar su rango. 


Ejemplo 6. 


(a) Sea 
4=(| 2 1 i): 


Nótese que los renglones de Æ son linealmente independientes pues uno 
no es múltiplo del otro. Luego, rango(4) = 2. 
(b) Sea 
11.3 1 1 
A=|1 O 1 1 
0300 
En este caso hay varias maneras para proceder. Supóngase que principia- 


mos con una operación elemental con renglones para obtener un cero en 
la posición 2, 1. Restando el primer renglón del segundo, obtenemos 


l 3 1 1 
0 —3 0 0 
0 3050 


Ahora nótese que el tercer renglón es un múltiplo del segundo, y que el 
primero y el segundo renglones son linealmente independientes. Por tanto, 
rango(A) = 2. 

Como un método alternativo, nótese que la primera, la tercera y la 
cuarta columnas de A son idénticas y que la primera y la segunda colum- 
nas de A son linealmente independientes. Por lo tanto, rango(4) = 2. 
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(c) Sea 
l 2 3 1I 
A=|2 1 1 1] 
l1 —1 1 0 
Utilizando diversas operaciones elementales con renglones y columnas, obte- 
nemos la siguiente secuencia de matrices: 


l 2 3 l l 2 3 1 
0 -3 —5 —1|,[0 —3 —5 1], 
0 -3 -2 -l 0 0 3 0 


1 0 00 1.000 
0 -3 -5 1) y [o -3 0 0). 
0. 0 3.0 0 030 


Es claro que la última matriz tiene tres renglones linealmente independien- 
tes y, por lo tanto, su rango es 3. 


En síntesis, realícense operaciones en renglones y columnas hasta que 
la matriz se haya simplificado lo suficiente, de tal manera que el máximo 
número de renglones o columnas linealmente independientes se haga evi- 
dente. 


La Inversa de una Matriz 


Hemos afirmado que una matriz de n x n es invertible si y sólo si su 
rango es n. Como ya sabemos cómo calcular el rango de cualquier matriz, 
ya podemos determinar si una matriz es o no invertible. Proporcionaremos 
ahora una técnica sencilla para calcular la inversa de una matriz, la cual 
empleará operaciones elementales con renglones. 


Definición. Sean A y B matrices de m x n y de m x p, respectivamente. Por 


matriz aumentada (A | B) entenderemos la matriz de m x (n + p) 
(At, ..., A", Bić, ..., BP), 


donde Ai y Bi significan la i-ésima columna de A y la j-ésima columna 
de B, respectivamente. 


Sea A una matriz invertible de n x n y considérese la matriz aumen- 
tada C = (A | In) de n x 2n. En virtud del Ejercicio 15 tenemos 


A?C = (ATA ATL = (Ip | A7). (1) 
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Por el Corolario 3 de] Teorema 3.5, A-1 es el producto de matrices ele- 
mentales, digamos A”* = E,E,-, ... E,. Entonces la Ecuación (1) se trans- 
forma en 


EE ... EXA | In) =47C= (L, | 47). 


Como multiplicar a una matriz por la izquierda por una matriz elemental 
transforma a la matriz en la misma forma que una operación elemental 
con renglones (Teorema 3.1), tenemos el siguiente resultado: Si A es una 
matriz invertible de n x n, entonces es posible transformar la matriz 
(A]|1,) en la matriz (1, | A.) por medio de un número finito de opera- 
ciones elementales con renglones. 

Recíprocamente, supóngase que A es invertible y que la matriz (A | £,,) 
puede ser transformada en la matriz (1, | B) mediante un número finito de 
operaciones elementales con renglones. Sean E, E2, ... , E, las matrices 
elementales asociadas con estas operaciones elementales con renglones como 
en el Teorema 3.1; entonces 


E, ...E:EXA|1,) = (n |B). (2) 
Haciendo M = E, ... E¿E,, tenemos de la ecuación (2) que 


M(A | 1.) = (MA | M) = (l, | B). 


Por lo tanto MA = I, y M = B, y se tiene entonces que M = A”. Así 
B = M = A”. Así se tiene el siguiente resultado: Si A es una matriz 
invertible de n x n y si la matriz (A | In) se transforma en una matriz de 
la forma (L, | B) por medio de un número finito de operaciones elemen- 
tales con renglones, entonces B = A”. 

El ejemplo siguiente ilustra este procedimiento. 


Ejemplo 7. Calcularemos la inversa de la matriz 


0 2 4 
A=|2 4 2]- 
3 3 1 
(El lector puede verificar que rango(4) = 3 para estar seguro de que A 
es invertible.) Para calcular A~ debemos utilizar operaciones elementales 
con renglones para transformar la matriz 
024100 
(AD =4|2 4 2 0 1 0 
3 3 100 1 
en (I| 47). El método más eficiente para llevar a cabo esta transforma- 


ción es transformar sucesivamente las columnas de A, empezando por la 
primera columna, en la correspondiente columna de /. Como necesitamos 
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un elemento no nulo en la posición 1,1, principiaremos intercambiando 
los renglones 1 y 2. El resultado es 

242010 

0.24 150 0]. 

33100 1 
A fin de colocar un 1 en la posición 1,1 debemos multiplicar el primer 
renglón por +; esta operación nos da 

1210340 

02 4100p 

33100 1 


Ahora completamos nuestra labor sobre la primera columna al sumar al 
tercer renglón —3 veces el primero para obtener 


1 2 10 40 

0. 2 41 0 0j. 

0 —3 —2 0 -—% 1 

Para transformar la segunda columna de la matriz anterior en la segun- 

da columna de / multiplicaremos el renglón 2 por 4 para obtener un 1 
en la posición 2,2. Esta operación da 

l 2 10 40 

0 1 24 0 0p 

0 —3 —2 0 —% 1 
Podemos ahora completar el trabajo en la segunda columna sumando —2 


veces el renglón 2 al renglón 1 y 3 veces el renglón 2 al renglón 3. 
El resultado es 


1 0 —3 —1 40 
01 2 4 0o} 
00 4 3 3 1 


Unicamente queda por transformar la tercera columna. Para colocar 
un 1 en la posición 3,3 multiplicamos el renglón 3 por +; esta operación 


da 
10 —3 —1 4 0 
01 2 4 000p 
00. 1 34 34 


La suma de múltiplos apropiados del renglón 3 a los renglones 1 y 2 
completa el proceso y da 


158 Operaciones en matrices y sistemas de ecuaciones lineales 
100 4- 4 
0.1- 0 =p 3 =i 
0 0 1 ii ł 
Entonces 
$- 4 
ai=- 44 
o 4 
El ser capaces de calcular la inversa de una matriz nos permite calcu- 
lar el inverso de una transformación lineal. El ejemplo siguiente muestra 
la técnica. 
Ejemplo 8. Sea T: P,(R)— P:.(R) definida mediante T(f) = f+ F + 
f”, donde f' y f” son la primera y la segunda derivadas de f. Se puede 
demostrar fácilmente que N(T) = {0}, de manera que T es invertible. To- 
mando 8 = (1, x, x?), tenemos 
1 1 2 
[T]; => 1 2f 
0 0 1 
Y encontramos que la inversa de la matriz es 
1 —1 0 
0 1 —2 
0 0 1 
Pero ([T]s) = [T-*]g por el Corolario 1 del Teorema 2.21. Por lo tanto, 
por el Teorema 2.16, tenemos que 
N 
T (ao + ax + ax?) = (a, — a,) + (a, — 2a,)x + ax’. 
EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) El rango de una matriz es igual al número de sus columnas no nulas. 

(b) El producto de dos matrices siempre tiene rango igual al menor de 
los rangos de las dos matrices. 

(c) La matriz cero de m x n es la única matriz de m x n de rango 0. 

(d) Las operaciones elementales con renglones conservan el rango. 

(e) Las operaciones elementales con columnas no necesariamente conser- 
van el rango. 


2. 
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(f) El rango de una matriz es igual al máximo número de renglones li- 
nealmente independientes de la matriz. 

(g) La inversa de una matriz se puede calcular exclusivamente por medio 
de operaciones elementales con renglones. 

(h) El rango de una matriz de n x nes a lo más n. 

(1) Una matriz de n x n de rango n es invertible. 


Encontrar el rango de las matrices siguientes: 


(a) /1 1 0 (b) /1 1 0 (e) /1 0 2 
O 1 1 2 1 1 aia 
1 1 0 i l1 1l 

(d) /1 2 1 (e) 1. 2 311 
Ls 2) 14 012 

0 2 —3 0 1 

10 000 
(£) 1 20 1 (9 yn 1 0 1 
2 41 30 2 2 02 
3 62 51 1 1 0 1 
—4 —8 1 —3 1 1 1 0 1 


Demostrar que para cualquiera matriz A de m x n, rango(4) = 0 si y sólo 
si A es la matriz nula. 


Utilizar operaciones elementales con renglones y columnas para transformar 
cada una de las matrices siguientes en una matriz D que satisfaga las condi- 
ciones del Teorema 3.5, y luego determinar el rango de cada matriz. 


(a) [1 1 2 b) / 2 1 
20-12 -1 2 
11l 12 2 1 


Para cada una de las siguientes matrices calcular el rango y la inversa, si 
ésta existe. 


(a /1 2 (b) /0 -2 4 (c) 1.2 1 
h r) I1 1 —l —1 1 2 
2 4 =5 1 O 1 
(d /1 2 1 (e) / 0 i 1 
1 O 1 loli 2 
l1 l1 2 O 1.0 


160 Operaciones en matrices y sistemas de ecuaciones lineales 
6. Para cada una de las siguientes transformaciones lineales T, determinar si 
T es invertible y calcular T~ si existe. 


(a) T: P.(R) =>P,(R) definida por T(f) = f” + 2f — f 
(b) T: R?— R? definida por 


T(a,, a2, 43) = (a, + 2a, + a3, —a, + az + 2az, a, + ay) 
(c) T: R*>P¿(R) definida por 
T(a,, 2, az) = (a, + da + az) + (a — A + as)x + ax? 


7. Expresar la matriz invertible 
I 2 1 
1 0 1 
W 12 
como un producto de matrices elementales. 


8. Sea A una matriz de m x n. Demostrar que si c es cualquier escalar no 
nulo, entonces rango(cA) = rango(A). 


9. Completar la demostración del Corolario 2 del Teorema 3.3 demostrando 
que las operaciones elementales con columnas conservan el rango. 


10. Demostrar el Teorema 3.5 para el caso en que A es una matriz de m x 1. 


11. Sea 


donde B’ es una submatriz de m x n. Demostrar que si rango(B) =r, 
entonces rango(B') =r— 1. 


12. Sean B’ y D’ matrices de m x n y sean B y D las matrices de (m + 1) x 
(n:+ 1) definidas por 


13. 


14. 


15. 


16. 


3.3 
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Demostrar que si B’ puede transformarse en D’ mediante una operación 
elemental con renglones [columnas], entonces B puede transformarse en D 
mediante una operación elemental con renglones. 


Demostrar los incisos (b) y (c) del Corolario 2 del Teorema 3.5. 


Sean T, U: V— W transformaciones lineales. Demostrar que 


(a) R(T+U) CR(T) + R(U). 

(b) Si W es dimensionalmente finito, entonces rango(T + U) < rango(T) 
+ rango(U). 

(c) Deducir del inciso (b) que, para cualquier par de matrices Á y B 
de m x n, rango(A + B) < rango(A) + rango(B). 


Si A y B son matrices de n renglones, demostrar que M(A|B) = (MA | 
MB) para cualquier matriz M de m x n. 


Demostrar que si B es una matriz de 3 x 1 y C una matriz de 1 x 3 enton- 
ces el rango de la matriz BC de 3 x 3 es a lo más 1. Recíprocamente, 
demostrar que si A es cualquier matriz de 3 x 3 con rango 1, entonces 
existen una matriz B de 3 x 1 y una matriz C de 1 x 3 tales que A = BC. 


SISTEMAS DE ECUACIONES LINEALES: 
ASPECTOS TEORICOS 


Esta sección y la siguiente están dedicadas al estudio de los sistemas de 
ecuaciones lineales, los cuales se presentan de manera natural tanto en las 
ciencias físicas como en las sociales. En esta sección aplicaremos los re- 
sultados del Capítulo 2 para describir a los conjuntos solución de los 
sistemas de ecuaciones lineales como subconjuntos de un espacio vectorial. 
En la Sección 3.4 se utilizarán operaciones elementales con renglones para 
proporcionar un método de cálculo para encontrar todas las soluciones a 
tales sistemas. 
El sistema de ecuaciones 


aX + aX Ec + ainXn = Dbi 
az,X1 + a22% F t: F aznXn = b, 
a 


(S) 


Am1iX1 + Am2X2 tE A + AmnXn 7 bms 


donde a; y bA <i<Kmy1I<j<S n) son elementos de un campo F 
Y Xi, Xz, - +. , Xn SON n variables que toman valores en F, se denomina un 
sistema de m ecuaciones lineales con n incógnitas sobre el campo F. 
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La matriz de m x n 


Amı "e Amn 


se llama la matriz de coeficientes del sistema (S). 
Si expresamos a X y B como 


Xı b, 


Xn Dm 
entonces el sistema (S) se puede reescribir como una ecuación matricial 
única 
AX =B. 
Para utilizar los resultados que hemos desarrollado hasta ahora, a menu- 
do consideraremos a un sistema de ecuaciones lineales como una ecuación 


matricial única. 
Una solución del sistema (S) es una n-dimensional 


tal que As = B. El conjunto de todas las soluciones del sistema (S) se 
llama conjunto solución del sistema. 
Ejemplo 9. 


(a) Considérese el sistema 


X1 x= 3 

X1 7 X = l. 
Utilizando técnicas conocidas podemos resolver el sistema anterior y con- 
cluir que existe una solución única: x, = 2, x = 1; es decir, 


s=(1): 


El sistema puede escribirse de forma matricial como 


G G) 76): 
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a=(i i)? B= (3) 


(b) Considérese 


entonces 


2x, + 3x + x3=1 
X— x + 2x, = 6; 


X 

Xz = . 
1 —1 2 6 

x 


Este sistema tiene muchas soluciones tales como 


o bien, 


—6 8 
s = 2 y s=ļ|—4 
7 —3 


(c) Considérese 


Xx +x=0 
Xxx =1l; 


( 1 IN /xNY (0 
1 1Ax) 11) 
Es evidente que este sistema no tiene soluciones y entonces vemos que 


un sistema de ecuaciones lineales puede tener una, muchas o ninguna 
solución. 


o bien, 


Debemos ser capaces de reconocer cuándo un sistema tiene soluciones 
y luego ser capaces de describir todas las soluciones. Esta sección y la 
siguiente estarán dedicadas a este fin. 

Principiaremos nuestro estudio de sistemas de ecuaciones examinando 
el tipo de sistemas “homogéneos” de ecuaciones lineales. Como veremos 
posteriormente (Teorema 3.7), el conjunto de soluciones de un sistema 
homogéneo de m ecuaciones lineales con n incógnitas forma un subespacio 
de F". Podemos entonces aplicar la teoría de los espacios vectoriales a 
este conjunto de soluciones. Por ejemplo, se puede encontrar una base 
para el espacio solución y cualquier solución puede expresarse como una 
combinación lineal de los vectores de la base. 


Definición. Se dice que un sistema AX = B de m ecuaciones con n incógnitas 


es homogéneo si B = 0; de lo contrario se dice que el sistema es no 
homogéneo. 
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Todo sistema homogéneo tiene al menos una solución, a saber, 
0 


0 
Esta solución se denomina la solución trivial. El siguiente resultado pro- 


porciona más información sobre el conjunto de soluciones de un sistema 
homogéneo. 


Teorema 3.7. Sea AX = Q un sistema homogéneo de ecuaciones lineales con 
n incógnitas sobre un campo F. Sea K el conjunto de todas las soluciones 
para AX = 0. Entonces K = N(La); por lo tanto, K es un subespacio de 
En de dimensión n — rango(L1) = n — rango(A). 


DEMOSTRACIÓN. K= ([s€F": As= 0) = N(La). La segunda parte se si- 
gue del Teorema 2.3. E 


Corolario. Si m < n el sistema AX = 0 tiene una solución no trivial. 
DEMOSTRACIÓN. Supóngase que m < n. Entonces rango(4) = rango(L,) 
< m, y entonces dim(K) = n — rango(L,) > n — m > 0. Como dim(K) 


> 0, K Æ {0}. Luego, existe s € K, s 0. Entonces s es una solución no 
trivial para AX = 0. E 


Ejemplo 10. 
(a) Considérese el sistema 


xı t 2x: +x =O 
ʻďL— xr- E Ó 


A 
4=( -1 ai) 


la matriz de coeficientes. Es evidente que rango(4) = 2. Si K es el 
conjunto solución del sistema, entonces dim(K) = 3 — 2 = 1. Luego, 
cualquier solución no nula será una base para K. Por ejemplo, como 


1 
pe 
3 


Sea 


es una solución, 
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es una base. Entonces cualquier elemento de K es de la forma 


1 t 
ti —2| =| —2 h: 
3 3t 


donde 1ER. 

(b) Considérese al sistema x, — 2x, + x, = O de una ecuación ccn 
tres incógnitas. Si A = (1, —2, 1) es la matriz de coeficientes, rango(A) 
= 1. Por lo tanto, si K es el conjunto solución, dim(K) = 3 — 1 = 2. 
Nótese que 


2 1 
1 y 0 
0 —1 


son elementos de K linealmente independientes. Por lo tanto constituyen 
una base para K, tal que 


2 1 
K = fı 1 +t ol: t,,t, E Rf" 
0 —1 


En la Sección 3.4 expondremos métodos explícitos de cálculo para 
encontrar una base para el conjunto solución de un sistema homogéneo. 


Ahora pasaremos al estudio de los sistemas no homogéneos. Nuestro 
siguiente resultado muestra que el conjunto de soluciones de un sistema no 
homogéneo AX = B puede expresarse en términos del conjunto de solu- 
ciones del sistema homogéneo AX = 0. Nos referiremos a la ecuación 
AX = 0 como al sistema homogéneo correspondiente a AX = B. 


Teorema 3.8. Sea K el conjunto solución de un sistema de ecuaciones lineales 
AX = B y sea Ky el conjunto solución del sistema homogéneo corres- 
pondiente AX = 0. Entonces para cualquier solución s de AX = B 


K = fs} + Ky = fs + k: k € Kp}. 


DEMOSTRACIÓN. Sea s cualquier solución de AX = B. Demostraremos que 
K = {s} + Kn. Si w€ K, entonces Aw = B. De aquí que A(w — s) = 
Aw — As = B — B = 0. Entonces w — s€ Ky. Luego, existe k € Ky tal 
que w — s = k, de manera que w = s + kE{s} + Ku, y por lo tanto 


K & {s} + Kp. 


Recíprocamente, supóngase que w€ {s} + Ky entonces w=s+k 
para alguna k€K. Pero entonces Aw = A(s + k) = As+Ak=B+0 
= B, de manera que w € K. Por lo tanto {s} + Ku C K y entonces K = 
{s} + Ku. E 
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Ejemplo 11. 
(a) Considérese el sistema 


x t 2x tx = 7 

Xı PS Xo b Xz = —4. 
El sistema homogéneo correspondiente al anterior es el sistema dado en 
el Ejemplo 10(a). Puede comprobarse fácilmente que 


l 


4 


es una solución del sistema no homogéneo anterior. Así, el conjunto solu- 
ción del sistema es 


1 1 
K=41 1 |+ t —2 tER 
4 3 


por el Teorema 3.8. 
(b) Considérese al sistema x, — 2x, + x, = 4. El sistema homogé- 
neo correspondiente a este sistema está dado en el Ejemplo 10(b). Como 


4 


es una solución de este sistema, el conjunto completo de soluciones K se 
puede escribir como 


4 2 l 
K = 0 + ti 1 +t 0 : t, h ER E 
0 0 —1 


Aun cuando se haya reservado la Sección 3.4 para métodos de cálculo, 


el teorema siguiente nos proporciona un medio para calcular las soluciones 
de ciertos sistemas de ecuaciones. 


Teorema 3.9. Sea AX = B un sistema de n ecuaciones y n incógnitas. Si A es 


invertible, entonces el sistema tiene exactamente una solución, que será 
AB. Inversamente, si el sistema tiene únicamente una solución, entonces 
A es invertible. 


DEMOSTRACIÓN. Supóngase que A es invertible. Sustituyendo A"'B en el 
sistema, tenemos A (4B) = (AA*)B = B, de manera que 47B es una 
solución. Si s es una solución arbitraria, entonces As = B y al multiplicar 
ambos lados por 4”* se tiene que s = A”"B. Por tanto, el sistema tiene 
una y sólo una solución, que es AB. 


Sistemas de ecuaciones lineales: aspectos teóricos 167 


Recíprocamente, supóngase que el sistema tiene exactamente una solu- 
ción s. Sea Ky el conjunto solución para el sistema homogéneo correspon- 
diente AX = 0. Por el Teorema 3.8, {s} + Kn, pero esto sólo puede 
tenerse cuando Ky = (0). Entonces N(L,) = {0} y por lo tanto A es 
invertible. W 


Ejemplo 12. Considérese el siguiente sistema de 3 ecuaciones con tres 
incógnitas: 
2x, + 4x, = 2 
(S) 42x, + 4x, + 2x; = 3 
3x, + 3x, + x% =l. 


En el Ejemplo 7 calculamos la inversa de la matriz de coeficientes Æ de 
este sistema, por lo que (S) tiene exactamente una solución: 


xi) to 4/2 —$ 
x |=4B=|—-} 3 —i3]=| 2) 
X3 + Y $ 

Utilizaremos esta técnica para resolver sistemas de ecuaciones lineales 
cuyas matrices de coeficientes son invertibles en la aplicación que da fin 
a esta sección. 

En el Ejemplo 9(c) vimos un sistema de ecuaciones lineales que no 
tenía solución. Estableceremos ahora un criterio para determinar cuándo 
un sistema tiene soluciones. Este criterio involucra el rango de la matriz 
de coeficientes del sistema AX = B y el rango de la matriz (A | B). A la 
matriz (A | B) se le denomina matriz aumentada del sistema AX = B. 


Teorema 3.10. Sea AX =B un sistema de ecuaciones lineales. Entonces el 
sistema tiene al menos una solución si y sólo si rango(A) = rango(A | B). 


DEMOSTRACIÓN. Decir que AX = B tiene solución, equivale a decir que 
B E€R(L1). En la demostración del Teorema 3.4 vimos que R(L4) = L(4A?, 
A?,..., 4”), es el subespacio generado por las columnas de A. En- 
tonces AX = B tiene una solución si y sólo si B pertenece a dicho sub- 
espacio. Pero BEL(A?, A?, ... , A”) si y sólo si L(A?, A”, ..., A") = 
L(4?, A?,..., A”, B}. Esta última proposición es equivalente a 
dim(L(4?, A?,..., A”) = dim(L(4”, A?,..., A”, B)). 
Y de acuerdo con el Teorema 3.4, la ecuación anterior se reduce a 


rango(4) = rango(4¡B). E 
Ejemplo 13. Recuérdese el sistema de ecuaciones 


XA+x=0 
lo | 


del Ejemplo 9(c). 
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Puesto que 


Dea E 2 (1.1.0 
aai 1) y (418) = (, 1 1) 


rango(A) = 1 y rango(A | B) = 2. Como los rangos no son iguales, el 
sistema no tiene soluciones. 


Ejemplo 14. Utilizaremos el Teorema 3.10 para determinar si (3, 3, 2) 
está en el rango de la transformación lineal T: R?— R? definida por 


T(a,, 42, 43) = (a, + a, + az, a, — a, + az, a, + az). 


Pero tenemos que (3, 3, 2) ER(T) si y sólo si existe un vector s = (x, 
X2, X3) € R? tal que T(s) i= (3, 3, 2). Tal vector s deberá ser una solución 
del sistema 

APA AO 

A a e RS 

X += 2. 


Como los rangos de la matriz de coeficientes y de la matriz aumentada de 
este sistema son 2 y 3, respectivamente, se tiene que este sistema no tiene 
soluciones. Por lo tanto, (3, 3, 2) £R(T). 


Una aplicación 


En 1973 Wassily Leontief ganó el Premio Nobel de Economía por su 
trabajo en el desarrollo de un modelo matemático que se puede utilizar 
para describir diversos fenómenos económicos. Terminaremos esta sección 
aplicando algunas de las ideas que hemos estudiado para ilustrar dos casos 
especiales de su trabajo. 

Principiaremos considerando una sociedad sencilla constituida por tres 
personas (empresas): un campesino que produce todos los alimentos, un 
sastre que hace todo el vestido y un carpintero que construye todo lo de 
la vivienda. Supondremos que las tres personas venden y compran en un 
abasto central y que todo lo que se produce se consume. Como ningún 
producto entra o sale del sistema, en este caso se trata del modelo cerrado. 

Cada uno de los tres individuos consumirá de cada uno de los tres 


productos producidos dentro de la sociedad. Supóngase que la proporción 


de cada uno de los productos consumidos por cada una de las personas está 
dada en el cuadro siguiente. Nótese que cada una de las columnas del 
cuadro deben sumar 1. 


Alimentación Vestido Vivienda 
Campesino 0,40 0.20 0.20 
Sastre 0.10 0.70 0.20 


Carpintero 0.50 0.10 0.60 
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Sean pı, P: y ps respectivamente los ingresos del campesino, del sastre 
y del carpintero. Para tener la certeza de que esta sociedad sobrevive, se 
requiere que el consumo de cada individuo sea igual a su ingreso. En el 
caso del campesino, este requisito puede traducirse en la ecuación 
0.40p, + 0.20p, + 0.20p, = pı. Entonces necesitamos considerar el sis- 
tema de ecuaciones lineales 


0.40p, + 0.20p, + 0.20p; = Pp, 
0.10p, + 0.70p, + 0.20ps = Pez 
0.50p, + 0.10p, + 0.60p; = Ds 


o su equivalente, AP = P, donde 


P3 


y A es la matriz de coeficientes del sistema. Dentro de este contexto Á 
se denomina matriz de consumo y AP = P la condición de equilibrio. 

Para matrices B .y C del mismo tamaño utilizaremos la notación 
B > C[B > C] para indicar Bi; > Cu[Bi; > Ci¡] para toda i y j. B se 
denominará no negativa [positiva] si B > O[B > Ol, donde O es la matriz 
nula. 

Al principio puede parecer razonable reemplazar la condición de equi- 
librio por la desigualdad AP < P, esto es, la condición que el consumo 
no exceda a la producción. Pero de hecho AP < P implica que AP = P 
en el modelo cerrado, pues de otra manera existiría una k para la cual 


Pr > Y» AxjD;- 
j 
Por tanto, como las columnas de A suman 1, 
2 pi> NN Aup = E (AA 10D) Pi 
i i j j i j 


lo cual es una contradicción. 
Una solución del sistema homogéneo (I — A)X = 0 equivalente a la 
condición de equilibrio es 
0.25 
P=|0.35]- 
0.40 


Podemos interpretar este hecho como indicando que la sociedad sobrevivirá 
si el campesino, el sastre y el carpintero tienen ingresos en la proporción 
25:35:40 (o 5:7:8). 

Nótese que no estamos interesados simplemente en una solución no 
trivial al sistema, sino en una que sea no negativa. Por ello debemos consi- 
derar si el sistema (1 — A)X =0 tiene o no una solución no negativa, 


170 Operaciones en matrices y sistemas de ecuaciones lineales 


donde A sea una matriz no negativa cuyas columnas suman 1. Un teore- 
ma útil en este aspecto [cuya demostración puede encontrarse en la publi- 
cación “Aplicaciones de las Matrices a Modelos Económicos y a las 
Interrelaciones de las Ciencias Sociales” de Ben Noble, Proceedings of the 
Summer Conference for College Teachers on Applied Mathematics (1971), 
CUPM, Berkeley, California] se enuncia a continuación. 


Teorema 3.11. Sea A una matriz de consumo de n x n de la forma 
_(B C 
a=(» E) 
donde D es una matriz positiva de 1 x (n— 1) y C es una matriz positiva 


de (n — 1) x 1. Entonces (I — A)X = 0 tiene un conjunto de soluciones 
unidimensional generado por un vector no negativo. 


Obsérvese que toda matriz de consumo positiva satisface la hipótesis 
de este teorema. La matriz siguiente también la satisface. 


0.75 0.50 0.65 
0 0.25 0.35 
0.25 0.25 0 


En el modelo abierto suponemos que existe una demanda externa para 
cada uno de los productos producidos. Volviendo a nuestra sociedad sen- 
cilla, sean x,, x2 y x, las cantidades de alimento, vestido y vivienda produ- 
cidas en función de las demandas externas d,, d, y d;. Sea A la matriz 
de 3 x 3 tal que A;; representa la proporción del producto i consumido 
en producir el producto j. Entonces el superávit de alimentos en la so- 
ciedad es 

Xy — (Ax, + Aix: + Ai:X:), 


esto es, la cantidad de alimentos producidos menos la cantidad de alimen- 
tos consumidos para producir los tres productos. La suposición de que 
todo lo producido se consume nos da una condición de equilibrio similar 
para el modelo abierto, esto es, que los superávits de cada uno de los 
tres productos deben ser iguales a las correspondientes demandas externas. 
Por lo tanto 
3 
xi — NA ¡ix = di para j= 1, 2 y 3. 
j=1 
En general, debemos encontrar una solución no negativa para el siste- 
ma (1 — A)X = D, donde A y D son matrices no negativas y la suma 
de los elementos de las columnas de A no es mayor que uno. Es fácil 
ver que si (7 — A)! existe y es no negativa, entonces la solución deseada 
será (1 — A)7D. 
Recuérdese que para un número real a, la serie 1 + a+ a+... con- 
verge a (1 — a)” si |a| <1. De la misma manera puede demostrarse 
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(utilizando el concepto de convergencia de matrices desarrollado en la 
Sección 5.3) que la serie I + A + A? +... converge a (1 — A)” si A” 
ccnverge a la matriz nula. En este caso (1 — A)”* será no negativa puesto 
que las matrices 7, A, A?, ... son no negativas. 

Para ilustrar el modelo abierto, supóngase que el 30% de los alimen- 
tos se utiliza para producir alimentos, 20% para producir vestido y 30% 
para la vivienda. De la misma forma, supóngase que el 10% del vestido 
se destina a la producción de alimentos, 40% para producir vestido y 
10% para la vivienda. Finalmente, supóngase que 30% de la vivienda 
se utiliza para producir alimentos, 20% para producir vestido y 30% 
para la producción de la vivienda. Entonces, la matriz de consumo es 


0.30 0.20 0.30 
A=|0.10 0.40 0.10), 
0.30 0.20 0.30 
y entonces 
0.70 —0.20 —0.30 20 10 10 
I—A=|-—0.10 0.60 —0.10 y (1—-Ay*=|l0.5 2.0 0.5} 
—0.30 —0.20 0.70 1.0 10 2.0 


Como (1 — A)” es no negativa podemos encontrar una solución no nega- 
tiva (única) para (1 — A)X = D para cualquier demanda D. Por ejemplo 
si 


30 
D=|201, 
10 
entonces 
90 
x=(1- Ay:D=l60|. 
70 


Entonces, se debe producir un volumen de producción de 90 unidades de 
alimentos, 60 unidades de vestido y 70 unidades de vivienda para satis- 
facer una demanda de 30 unidades de alimentos, 20 unidades de vestido 
y 10 unidades de vivienda. 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Cualquier sistema de ecuaciones lineales tiene al menos una solución. 
(b) Todo sistema de ecuaciones lineales tiene como máximo una solución. 
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(c) 
(d) 
(e) 
(£) 


(g) 


(h) 


Cualquier sistema homogéneo de ecuaciones lineales tiene al menos 
una solución. 

Cualquier sistema de n ecuaciones lineales con n incógnitas tiene 
como máximo una solución. 

Cualquier sistema de n ecuaciones lineales con n incógnitas tiene al 
menos una solución. 

Si el sistema homogéneo correspondiente a un sistema de ecuaciones 
lineales dado tiene una solución, entonces el sistema dado tiene una 
solución. 

Si la matriz de coeficientes de un sistema homogéneo de m ecuaciones 
lineales con n incógnitas es invertible, entonces el sistema carece de 
soluciones triviales. 

El conjunto solución de cualquier sistema de m ecuaciones lineales 
con n incógnitas es un subespacio de F”. 


Para cada uno de los siguientes sistemas de ecuaciones lineales, encontrar 
la dimensión y una base para el conjunto solución. 


(a) | 


xit X2 — Xi =0 (b) 2x, + Xa — X; = 0 


4x, + x, — 2x, = 0 Xi — xX, + x, = 0 


x, + 2x, — 2x, = 0 


(0) xı + 2x, — 3x3 + x, =0 (d) o 


Xi — x, = 0 


Utilizando los resultados del Ejercicio 2 encontrar todas las soluciones de 
los siguientes sistemas. 


(a) l 


xi t xXx — Xa =] (b) 2x, + X2a — Xa 


4x, + x, — 2x3 = 3 X— X2+ x3=l 


xı + 2x, — 2x3 =4 


(0) xi t 2x, — 3x3 +x, = l (d) — 5 


Xi — xX, =-—l 


Sea A la matriz de coeficientes de 


(a) 
(b) 
(c) 


xı +2x,-—x3=525 

Xt atal 

2x, — 2x, +x3 = 4. 
Demostrar que 4 es invertible. 


Calcular 4”. 
Utilizar A”? para resolver el sistema. 


Dar un ejemplo de un sistema de n ecuaciones con n incógnitas con un 
número infinito de soluciones. 


10. 


1. 


3.4 
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Sea T: R*>R? definida por Tía, b, c) = (a + b, 2a — c). Describir 
Td, 11)). 


Determinar cuál de los siguientes sistemas de ecuaciones lineales tiene so- 
lución. 
(a) xı + Xx Xx3+2x,=2 (b) pata x, =1 


xi H xXx, + 2x = 1 2x, + x, + 3x, =2 
2x, H 2x, + x, + 2x, =4 

(c) (x, + 2x, + 3x; =: (d) xı + xX -+ 3x; — x, =0 
xit Xx — x, =0 x+ xt xy tx =l 
xi + 2x, + x3=3 Xi — 2x, + x, — x, =l 


Ax. + x + 8x; — x, =0 


Demostrar que un sistema AX = B de m ecuaciones lineales con n incóg- 
nitas tiene solución si y sólo si B ER(La). . 


Demostrar o dar un contraejemplo al siguiente enunciado: Si la matriz de 
coeficientes de un sistema de m ecuaciones lineales con n incógnitas tiene 
rango m, entonces el sistema tiene una solución. 


En el modelo cerrado de Leontief con alimentación, vestido y vivienda como 
industrias básicas, supóngase que la matriz de consumo es 


2 4 4 
16 16 
A= (fs + f 


134 1 
¿En qué proporción deben producir el campesino, el sastre y el carpintero 
de manera que se alcance el equilibrio? 


En la representación del modelo abierto de Leontief, supóngase que 


1 
5 
1 
5 
y que el vector de demanda es D = ( . ¿Cuánto de cada producto se 


deberá producir para satisfacer esta demanda? 


SISTEMAS DE ECUACIONES LINEALES: 
ASPECTOS DE CALCULO 


- En la Sección 3.3 obtuvimos una condición necesaria y suficiente para que 


un sistema de ecuaciones lineales tenga soluciones (Teorema 3.10) y 
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aprendimos cómo expresar las soluciones de un sistema no homogéneo en 
términos de las soluciones del sistema homogéneo correspondiente (Teo- 
rema 3.8). Este último resultado nos permite determinar todas las solu- 
ciones de un sistema dado si podemos encontrar una solución de dicho 
sistema y una base para el conjunto solución del sistema homogéneo corres- 
pondiente. En esta sección utilizaremos las operaciones elementales con 
renglones para alcanzar estos dos objetivos. La esencia de esta técnica es 
transformar un sistema dado de ecuaciones lineales en un sistema que 
tenga las mismas soluciones pero que sea más fácil de resolver (como 
en la Sección 1.4). 


Definición. Dos sistemas de m ecuaciones lineales con n incógnitas se llaman 
equivalentes si tienen el mismo conjunto de soluciones. 


El siguiente teorema y su corolario nos proporcionan un método útil 
para obtener sistemas equivalentes. 


Teorema 3.12. Sea (S): AX = B un sistema de m ecuaciones lineales con n 
incógnitas y sea C cualquier matriz invertible de m x m. Entonces el 
sistema (S'): (CA)X = CB es equivalente a (S). 


DEMOSTRACIÓN. Sea K el conjunto de soluciones para (S) y K’ el con- 
junto de soluciones para (S'). Si w € K, entonces Aw = B. Luego entonces, 
CAw = CB y por lo tanto w € K’. Entonces K C K’. 


Recíprocamente, si w €K', entonces C4w = CB. En consecuencia, 
Aw = CŒ (CAw) = C? (CB) =B y así wEK. Entonces K' C K, y por 
lo tanto K = K'. B 


Corolario. Sea AX = B un sistema de m ecuaciones lineales con n incógnitas. 
Si (A' | B') se obtiene a partir de (A | B) mediante un número finito de 
operaciones elementales con renglones, entonces el sistema A'X = B' es 
equivalente al sistema original. 


DEMOSTRACIÓN. Supóngase que (4' | B') se obtiene de (A | B) por me- 
dio de operaciones elementales con renglones. Estas se pueden realizar 
multiplicando por matrices elementales de m x m E, ... , Ep Sea C = 
E, ... E,; entonces (4'|B') = C(A |B) = (CA | CB), y como todas 
las E; son invertibles también lo es C. Ahora bien, A’ = CA y B’ = CB. 
Luego, por el Teorema 3.12, el sistema 4'X = B' es equivalente al siste- 
ma AX =B. B 


Ejemplo 15. Para encontrar todas las soluciones de 


xi + 2x, + x, — x, =2 
Xi+ XFX; =D 
3x, + 2x, + 3x3 — 2x4 = 1 


|! 


` 
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construimos la matriz aumentada 


E a 
111 03 
e: 


del sistema y la simplificamos mediante una secuencia de operaciones ele- 
mentales con renglones de la siguiente manera. 


(a) Colocamos 1 en el primer renglón, primera columna. (Esto es 
ya el caso.) 
(b) Por medio de operaciones del tipo 3, utilizamos el primer ren- 
glón para obtener ceros en las posiciones restantes de la primera 
columna. La matriz que se obtiene es 
l 2 1 —! 2 
0 —l1 0 1 1 
0 —4 0 l —5 
Para las operaciones restantes ya no se utiliza el primer renglón. 
(c) Luego (utilizando los renglones restantes) colocamos un 1 en 
el segundo renglón y en la columna lo más a la izquierda posible —en 
este caso la segunda columna. Entonces hacemos operaciones con 
renglones del tipo 3 para obtener ceros en las posiciones restantes de 
esta columna. Estas operaciones dan 
1 O 1 l 4 
0 1 0 -—1 —l1 
0 0 0 —3 —9 
(d) Para terminar, utilizando únicamente el renglón restante, coloca- 
mos un 1 en el tercer renglón y la columna lo más a la izquierda po- 
sible, en este caso la cuarta columna. Por medio de operaciones del 
tipo 3, usamos este 1 para producir ceros en la cuarta columna, y 
así obtenemos 


1 0O 10 1 
0 1 0 0 m2] 
0 0 0 I 3 


Esta última matriz puede ser traducida a un sistema de ecuaciones 
ži xXx =l 
Xa = 2 
X4 — 3 


equivalente al sistema dado. Evidentemente x, = 2 y x, = 3, pero x, y 
x, pueden tener cualquier valor siempre que su suma sea 1. Haciendo 


176 


Operaciones en matrices y sistemas de ecuaciones lineales 


X, = t, tenemos entonces que x, = 1 — £. Luego, una solución arbitraria 
tiene la forma 


l—1 1 1 
2 | ]2 de 0j 
t 0 l 
3 3 0 


Obsérvese que 


es una base para el sistema de ecuaciones homogéneo correspondiente al 
sistema dado. 


En el ejemplo anterior realizamos operaciones elementales con renglo- 
nes en la matriz aumentada del sistema hasta obtener la matriz aumentada 
de un sistema con las propiedades 1, 2 y 3 dadas en la página 29. Esa 
matriz tiene un nombre especial. 


Definición. Se dice que una matriz es escalonada por renglones si se satisfacen 


las tres condiciones siguientes: 


(a) Cualquier renglón que tenga un elemento no nulo precederá a 
cualquier renglón (si es que existe alguno) donde todos los ele- 
mentos sean ceros. 

(b) El primer elemento no nulo de cada renglón es el único elemento 
no nulo en su columna. 

(c) El primer elemento no nulo en cada renglón es 1 y aparece en 
una columna que está a la derecha del 1 que encabeza a cual- 
quier renglón anterior. 


Ejemplo 16. 


(a) La primera matriz del Ejemplo 15(d) es una matriz escalonada 
por renglones. Nótese que el primer elemento no nulo de cada renglón es 
1 y que la columna que lo contiene tiene ceros en el resto de los elemen- 
tos. También véase que cada vez que nos desplazamos hacia abajo a un 
nuevo renglón, debemos desplazarnos cuando menos una (y posiblemente 
más) columna(s) hacia la derecha para encontrar el primer elemento no 
nulo del nuevo renglón. 
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(b) Las siguientes matrices no son escalonadas por renglones: 


1.1.0 
0 1 Op 
1 0 1 


porque la primera columna contiene más de un elemento no nulo; 


0 1 0 2 
1 0 0 Iþ 
0 0 1 1 


porque el primer elemento no nulo del segundo renglón no está a la 
derecha del primer elemento no nulo del primer renglón; y 


2 0 0 
0 1 07” 
porque el primer elemento no nulo del primer renglón no es 1. 


La facilidad con que resolvimos el sistema final de ecuaciories del 
Ejemplo 15, se debe al hecho de que la matriz aumentada de este sistema 
es una matriz escalonada por renglones. Presentaremos en seguida un 
procedimiento para resolver cualquier sistema de ecuaciones lineales para 
el cual la matriz aumentada sea una matriz escalonada por renglones. Sin 
embargo, primero estableceremos que toda matriz puede ser transformada 
en una matriz escalonada por renglones mediante operaciones elementales 
con renglones. 


Teorema 3.13. Toda matriz puede ser transformada en una matriz escalonada 
por renglones por medio de un número finito de operaciones elementales 
con renglones. 


DEMOSTRACIÓN. La demostración se hará por inducción sobre el número 
de columnas de la matriz. Dejaremos como ejercicio la demostración del 
resultado para matrices de una columna. Supóngase que la conclusión es 
válida para matrices que tienen n columnas, para algún entero n > 1, y 
sea A una matriz de m x (n + 1). Escríbase A en la forma A = 
(4' | B), donde B es la última columna de A y 4' es la matriz de m x n 
obtenida al suprimir la última columna de A. Por la hipótesis de induc- 
ción, A” puede ser transformada en una matriz Q escalonada por renglo- 
nes por medio de un número finito de operaciones elementales con renglo- 
nes. Sea C el producto de las matrices elementales que corresponden a 


estas operaciones con renglones. Entonces 


CA = C(4'|B) = (CA'|CB) = (Q | B’), 
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donde B’ = CB. Claramente (Q | B’) es una matriz escalonada por ren- 
glones a menos que contenga un renglón de la forma (0... © a) donde 
a #0. Multiplicando a tal renglón por a”', sumando múltiplos adecuados 
de este renglón a los otros renglones y realizando el intercambio adecua- 
do de renglones, para alguna j podemos transformar (Q | B’) en una ma- 
triz (Q | e;) escalonada por renglones por medio de un número finito de 
operaciones elementales con renglones. Esto completa la inducción. $ 


Puede demostrarse (véase el Ejercicio 9) que a toda matriz le corres- 
ponde una única matriz escalonada por renglones; esto es, si por distintas 
secuencias de operaciones elementales con renglones se transforma a la 
matriz en matrices Q y Q’, ambas escalonadas por renglones, entonces 
Q=. 

Describiremos ahora un método para resolver un sistema en el que 
la matriz aumentada sea una matriz escalonada por renglones. Para ilus- 
trar el procedimiento, consideremos al sistema 


2x, + 3x, + x, + 4x, — 9x, = 17 
Xit x+ x, + x, — 3x, = 
Xi tH x, + x; + 2x, — 5x; 
2x, + 2x, + 2x, + 3x, — 8x; = 14 


|l 
oo o 


para el que la matriz aumentada es 


23 14-917 
HEITA b 
1112 —5 g| 
2 2 2 3 —8 14 


La siguiente secuencia de matrices obtenida por operaciones con renglones 
ilustra cómo se transforma a la matriz aumentada en una matriz escalo- 
nada por renglones: 


PTS Li 11-36 
2314 917 Cr An E 
11125 83) loo o1 22l 
O E A 00 01-22 
10 2—1 01 10 20-23 
oii E 0O 1 -10 ıı 
00 0 122 E: o 1-2 2] 
00 0 0 00 00 00 00 
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El sistema de ecuaciones (equivalente al original) asociado con esta última 
matriz (considerada coro matriz aumentada) es 


Xi + 2x, — 2x; = 


Nótese que hemos ignorado al último renglón pues está totalmente formado 


por ceros. 
Para resolver un sistema para el cual la matriz aumentada toma la forma 
escalonada, divídase a las variables x,, x»,. . ., Xs en dos conjuntos. El primer 


conjunto consta de cada una de las variables que aparecen más a la 
izquierda en las ecuaciones del sistema (en este caso el conjunto es 
[x,, X2 x1)). El segundo conjunto consta del resto de las variables (en 
este caso, (x,, xs)). A cada variable del segundo conjunto se le asigna 
un valor paramétrico f, tz, ... (xx = fh, Xs = t) y se resuelve para las 
variables del primer conjunto en términos de las del segundo: 


Xi = —2x, + 2x, + 3 = —21 , + 2£, +3 


Jy = x, — x; +1= ti— 4+1 
Xa = 2x, + 2 = 2t, + 2. 
Así, una solución arbitraria, s, es de la forma 
X —21, + 2t, + 3 3 —2 2 
xa ti— t+l 1 1 —1 
s=|X3]| = UN = 0 + ti 1 + t, 0 , 

X4 2t, +2 2 0 2 
Xs fz 0 0 l 


donde f,, t. €R. Nótese que 


—2 2 
l —1 
1f, 0 
0 2 
0 l 


forma una base para el conjunto de soluciones correspondiente al sistema 
de ecuaciones homogéneo. 

Para utilizar este procedimiento para resolver un sistema de m ecua- 
ciones con n incógnitas AX = B, véase primero si rango(4) = rango 
(A |B). Si esta igualdad no se satisface, entonces el sistema no tiene 
soluciones. En seguida (siempre que el sistema tenga soluciones) utilícense 
operaciones elementales con renglones para transformar la matriz aumen- 
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tada (A |B) en una matriz escalonada por renglones (4' | B’). Descár- 
tense los renglones nulos en (4' | B’) y escríbase de nuevo el sistema de 
ecuaciones asociado con (4'|B”). Resuélvase el sistema como se hizo 
anteriormente y se obtendrá una solución arbitraria de la forma 


S z= So + liui + lUz + e... + ln-m'Unm'’, 


donde m' es el número de renglones no nulos en 4’, (m' < m). La ecua- 
ción anterior sugiere que una solución arbitraria, s, puede expresarse en 
términos de n — m parámetros. El teorema siguiente establece que s no 
puede expresarse en menos de n — m' parámetros. 


Teorema 3.14, Sea AX = B un sistema de m ecuaciones no nulas con n incóg- 
nitas. Supóngase que rango(A) = rango(A |B) y que (A|B) es una 
matriz escalonada por renglones. Entonces 


(a) rango(A) = m. 
(b) Si la solución general, obtenida por el procedimiento anterior es 
de la forma 


S = So + tiu, + teu: Toara T tiam Uian 


entonces (U,, Uz, ... , Unm} es una base para el conjunto de 
soluciones del sistema homogéneo correspondiente y Sọ es una 
solución del sistema original. 


DEMOSTRACIÓN. Como (A |B) es una matriz escalonada por renglones, 
rango(A | B) = rango(4) = m, de acuerdo con los Ejercicios 5 y6. 


Sea K el conjunto de soluciones para AX '= B y Ky el conjunto de 
soluciones para AX = 0. Haciendo t, = t = ... = tam = 0, 5s = EK. 
Pero por el Teorema 3.8, K = {so} + Ky, por lo que Ky = K — {so} = 
L((1,, Uz, ... , Unm)). 


Como rango(4) = m, dim(Ky) = n — m. Entonces como dim(K;y;) 
=n — m y Ky es generado por un conjunto (4, Uz, ... , Un-m) que con- 
tiene a lo más n — m elementos, concluimos que el conjunto anterior es 
una base para Ku. E 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Si (4'|B'”) se obtiene a partir de (A | B) mediante una secuencia 
finita de operaciones elementales con columnas, entonces los sistemas 
AX =B y A'X = P’ son equivalentes. 

(b) Si (4'|B') se obtiene a partir de (A | B) mediante una secuencia 
finita de operaciones elementales con renglones, entonces los sistemas 
AX =B y A'X = B' son equivalentes. 


2. 


5. 


(c) 
(d) 


(e) 
(£) 


(g) 
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Si A es una matriz de n x n de rango n, entonces la matriz escalo- 
nada por renglones de A es In. 

Cualquier matriz se puede convertir en una matriz escalonada por 
renglones por medio de una secuencia finita de operaciones elemen- 
tales con renglones. 

Si (A | B) es una matriz escalonada por renglones, entonces el siste- 
ma AX = B debe de tener una solución. 

Sea AX = B un sistema de m ecuaciones lineales con n incógnitas 
para el cual la matriz aumentada es una matriz escalonada por ren- 
glones. Si este sistema tiene solución, entonces la dimensión del con- 
junto de soluciones de AX = 0 es n — m', donde m es igual al núme- 
ro de renglones no nulos de 4. 

Si una matriz A se transforma por medio de operaciones elementales 
con renglones en la matriz escalonada por renglones 4”, entonces el 
número de renglones no nulos en A’ es igual al rango de 4. 


Encontrar todas las soluciones a los sistemas de ecuaciones en los Ejerci- 
cios 2, 3 y 4 de la Sección 3.3 mediante la técnica usada en esta sección. 


Supóngase que la matriz aumentada del sistema AX = B se transforma en 
la matriz escalonada (4’ | B’) mediante una secuencia finita de operaciones 
elementales con renglones. 


(a) 


(b) 


Demostrar que rango(4') + rango((A'|B')) si y sólo si (4' | B’) 
contiene un renglón en donde el único elemento no nulo queda ubi- 
cado en la última columna. 

Deducir que AX = B tiene soluciones si y sólo si (A' | B’) no contie- 
ne ningún renglón en el cual el único elemento no nulo está ubicado 
en la última columna. 


Para cada uno de los siguientes sistemas, aplicar el Ejercicio 3 para deter- 
minar si el sistema tiene soluciones. Si existen soluciones, encontrarlas todas. 
Finalmente, encontrar una base para los sistemas homogéneos correspon- 
dientes. 


(a) 


xı +2x= x; + x94=2 (b) (x,+x2.— 3x3 + x, = -—2 
2x, + E 2 x, =3 xı t x+ Xi x, = 2 
xı + 2x, — 3x; + 2x, =2 xı + xXx — X = 0 
(c) (xi + x — 3x, + x, =l 
Xit Xx + X3— xX, = 


Xy tH xXx — X3 = 0 


Demostrar que si Æ es una matriz escalonada por renglones, entonces ran- 
go(4) es igual al número de renglones no nulos de A. 
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Si (A | B) es una matriz escalonada por renglones, demostrar que A tam- 
bién es escalonada por renglones. 


Demostrar el Teorema 3.13 para matrices de una sola columna. 


Demostrar el Teorema 3.13 de la manera siguiente. Sea A una matriz de 
n x n de rango r. Como el resultado es inmediato para r = 0, supóngase 
r > 0. Sea 8 la base ordenada estándar para F", defínase W, = L(La(e,), 
La(ez), ... , Lalex)) para 1 < k <n y defínase k; = min(i: dim(W;) = 
j} para 1 < j < r. Demostrar que k, < ka < ... < k, y que k; > j para 
toda j. Sea z; = La (e, )» y demostrar que (Z,, Zz,. .-, Z} es linealmente 
independiente. Extender este conjunto a una base f” para F". Hacer B = 
[La]? y demostrar lo siguiente: 


B = CA para alguna matriz invertible C de m x m. 

B es escalonada por renglones. 

B se puede obtener a partir de A mediante un número finito de ope- 
raciones elementales con renglones. 


(a) 
(b) 
(c) 


Demostrar que si Q y Q’ son matrices de m x n escalonadas por ren- 
glones tales que Q puede ser transformada en Q’ por medio de un 
número finito de operaciones elementales con renglones, entonces 
Q = Q'. Sugerencias: Emplear inducción sobre n. 

Deducir que si Æ es cualquier matriz, entonces existe una única ma- 
triz escalonada por renglones que puede obtenerse a partir de A 
mediante un número finito de operaciones elementales con renglones. 


(a) 


(b) 
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Capítulo ran 


Determinantes 


Durante un tiempo los determinantes jugaron un papel fundamental en el 
estudio del álgebra lineal; ahora, sin embargo, tienen una importancia mu- 
cho menor. Veremos, de hecho, que virtualmente nuestra única utilización 
de los determinantes será en el cálculo de los “eigenvalores”. Por esta razón 
las cuestiones más importantes que serán necesarias para los próximos 
capítulos se resumen en la Sección 4.5, de manera que el lector que no 
esté interesado en seguir un desarrollo de la teoría de los determinantes 
podrá pasar inmediatamente a dicha sección. 

El determinante de una matriz cuadrada con elementos de un campo F 
es un escalar (elemento de F), por lo que podemos considerar al deter- 
minante como una función cuyo dominio es Mnxn(F) y que toma valores 
de F. Aun cuando el determinante de una matriz cuadrada pueda ser 
definido en términos de los elementos de la matriz, la definición resultante 
es comprometedora para ser utilizada en operaciones. En vez de definir 
el determinante de esta manera, en la Sección 4.2 definiremos al determi- 
nante como una función 3: Mnxn(F)— F que tiene tres propiedades 
importantes. En dicha sección también verificaremos que el método corrien- 
te para evaluar un determinante mediante la expansión a lo largo de una 
columna es, de hecho, un determinante en el sentido de nuestra defini- 
ción. La Sección 4.3 contiene otras propiedades adicionales de los determi- 
nantes y demuestra que existe un determinante único en M, yn (FF), es decir, 
que las tres propiedades que definen un determinante son satisfechas por 
una y sólo una función de Max» (F') en F. La Sección 4.4 utiliza los deter- 
minantes para encontrar la inversa de una matriz invertible y para resolver 
un sistema de ecuaciones lineales que posee una matriz de coeficientes 
invertibles por medio de la regla de Cramer. 

El capítulo principia con una exposición de la teoría general en una 
forma sencilla. En esta sección investigaremos también el significado geo- 
métrico de los determinantes en términos de área y orientación. Los lectores 
que hayan estudiado cálculo avanzado recordarán que un cambio de 
coordenadas en las integrales múltiples requería del uso de un determi- 
nante llamado jacobiano. 
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4.1 DETERMINANTES DE ORDEN 2 


Algunas veces asignaremos a toda matriz de n x n con elementos de un 
campo F un escalar llamado “el determinante” de la matriz, pero primero 
consideraremos un caso especial fácil. 


Definición. El determinante de una matriz A de 2 x 2 con elementos de un 
campo F es el escalar A,¡A,. — A,,A.,, que denotaremos por det(A). 


Ejemplo 1. Considérese el siguiente elemento de M,,.(R): 
_ [f1 2 
A= 6 4)- 


det(A) =1:4-2:3= -—2, 


Entonces 


En la exposición siguiente será conveniente representar una matriz A 
de 2 x 2 en términos de sus renglones; como anteriormente, escribiremos 


a= (4) 


y representaremos su determinante mediante 


A, 
det ( 4) 
El determinante tiene las siguientes propiedades importantes. 


Teorema 4.1. El determinante de una matriz de 2 x 2 satisface las tres condi- 
ciones siguientes: 


(a) El determinante es una función lineal de cada renglón cuando 
el otro renglón permanece fijo; esto es, 


cA tA A A 
der ( A ) c der || ) + der) 


2 A» 
A, A, A, 
deca har) =c der (4!) + det (A+) 


para todo escalar c en F. 
(b) Si A€M>2x2(F) tiene renglones idénticos, entonces det(A) = 0. 
(c) Sil es la matriz identidad de 2 x 2, entonces det(l) = 1. 


ll 


DEMOSTRACIÓN. 
(a) Sea A, = (A, A), A' = Al, A.) y A, = A, A.) 
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entonces 
cA + A' cA +A cA +4 
1 Y — 11 11 12 12 
det A. ) det ( Az As ) 


= (cA, + AJA, E (CA, + AJA, 
= c(A,A,, E A A.) + A4, E A Ar) 


22 


Á A A! A' 
c det 0 4:)+ det (E 4) 
A, A” 
c det (4.)+ det (4). 
Un argumento semejante demuestra que el determinante es también una 


función lineal del segundo renglón. 
(b) Si los renglones de A son idénticos, entonces A tiene la forma 


(4 Azz 
Ay Az ` 


Así, det(A) = AA? = AA = O. 
(c) Puesto que 
(10 
r= (o 1) 


det(71)=1:-1—0-0=1. E 


El siguiente resultado muestra que las tres propiedades mencionadas 
en el Teorema 4.1 caracterizan completamente al determinante tal como 
se definió anteriormente. 


Teorema 4.2. Sea 8: M:,:(F)— F una función cualquiera que tenga las tres 
propiedades siguientes: 


(a) 8 es una función lineal de cada renglón cuando el otro renglón 
se mantiene fijo. 

(b) Si AE€M»,2(F) tiene renglones idénticos, entonces S(A) = Q. 

(c) Sil es la matriz identidad de 2 x 2, entonces 8(1) = 1. 


Entonces 8 = det; esto es, S(A) = A,,A,. — Aj,zA», para toda A € Maz2a(F). 
DEMOSTRACIÓN. Sea 7 la matriz identidad de 2 x 2 y sean 


no (01 (01 
m=( o) M.=(0 1) y M=(, o): 


Obsérvese que 8(M,) = 8(M.) = O de acuerdo con la propiedad (b). 
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Primero demostraremos que 8(M,) = —1. Utilizando las propiedades (b) 
y (a) tenemos 


O a 
o=3( e 1 ) 
o no O 1 
za ¡tl i 

1 0 0 1 
ari oa 1+0) 


o/10 10 o 1 o 1 
=8( EDO 0) +e (o A o) 
= 8 (I) + 8(M,) + 8(M:) + 8(M,) 

1 +0+0+8(M»). 


Il 


Il 


Luego, entonces ¿(M,) = —1. 
Ahora sea A un elemento cualquiera de Mz,2+(F); entonces 


A Aiz iN AÁ + 0 0 eN As» 
( Az Az: ) 


o O E E a 
E NO+ Ars Aatto 0 + Az, 4. +0) 

_f[ÁAn 0 C/Ar 0 O Az O Ake 
=à% aa o) +? (o a 0”) 
1 0 1 0 o 1 
E (o 1) + 44 03( o) t Anta S(O 1) 


o 1 


= Ando S) + Aj Aa S(M,) + Ar As» * s(M;) + A2421 * 8(M3) 
= AnAs(1) T An Az: (0) + Aı2422(0) F Ap As (—1) 
= ÁA — Ar Aso, = det(A). 


[l 
a 
ES 
o» 


Y, por tanto,  = det. E 


Motivados por esta caracterización del determinante de una matriz 
de 2 x 2, en la Sección 4.2 definiremos un determinante en Ma n(F) 
como una función que posee las tres propiedades del Teorema 4.1. Pero 
primero veremos esta propiedad de unicidad para estudiar el significado 
geométrico del determinante de una matriz de 2 x 2. En particular, encon- 
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traremos que el signo del determinante es de importancia geométrica en 
el estudio de la orientación. 

Al hablar del ángulo entre dos vectores en R?, se entiende que hablamos 
del ángulo 0, tal que O < 9 < v, formado por los vectores de la misma 
magnitud y dimensión que los vectores dadós pero que parten del origen. 
(Véase Fig. 4.1.) Dados tres vectores u, v y w que parten del mismo pun- 
to, se dice que v está ubicado entre u y w si el ángulo entre u y w es 
igual a la suma de los ángulos entre u y v y entre v y w. (Véase Fig. 4.2.) 

Dada una base ordenada 8 = (u, v} para R?, donde u = (a,, a,) y 
v = (b,, b2) denotamos por 

det (5) 
v 


a q 
det ($ 9 , 


al escalar 


a 
/ x 
Angulo entre dos 
vectores en R 


figura 4.1 
xX 
v se encuentra entre u y w. v no se encuentra entre u y w. 
(Aquí w se encuentra entre u 
y v.) 
figura 4.2 


y definimos la orientación de 8 como el número real 
u det “ ) 
de 
o det ) 
(2 
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(Se deduce del Ejercicio 10 que el denominador no es cero.) Claramente 


o()==1 
v 

e&\ e) 
o($)=1 y A l. 


En general (véase el Ejercicio 11), 


Obsérvese que 


si y sólo si la base ordenada {u, v} forma un sistema coordenado dere- 
cho, y 


si y sólo si {u, v} forma un sistema coordenado izquierdo. (Recuérdese que 
un sistema coordenado {u, v} es derecho si u puede hacerse coincidir 
con v haciéndolo girar en contra de las manecillas del reloj un ángulo 0 
tal que 0 < 9 < v; de lo contrario (u, v} es un sistema coordenado iz- 
quierdo. Véase Fig. 4.3.) Por conveniencia, definimos 


si (u, v) es linealmente dependiente. 


Un sistema coordenado derecho Un sistema coordenado izquierdo 


figura 4.3 


Cualquier conjunto ordenado (u, v} en R? determina de la siguiente 
manera un paralelogramo. Considerando a u y a v como flechas que 
parten del origen de R?, llamamos al paralelogramo que tiene a u y a v 
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como lados adyacentes el paralelogramo determinado por u y v (véase 
Fig. 4.4). 


Paralelogramos determinados por u y v 


figura 4.4 


Obsérvese que si el conjunto (u, v} es linealmente dependiente, es 
decir, si u y v son paralelos, el “paralelogramo” determinado por u y v 
es en realidad un segmento de recta que podemos considerar como un 
paralelogramo degenerado cuya área es cero. 

Existe una relación interesante entre 


el área del paralelogramo determinado por u y v, y 


det a 3 
v 


que ahora procederemos a investigar. Sin embargo, obsérvese primero que 


como 
det (5) 
y 


puede ser negativo, no podemos esperar que 


eC) 


Pero podemos demostrar que 


de donde se tiene que 
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Con el argumento de que 


(=o C) 


utilizaremos una técnica que, aun cuando algo indirecta, podrá ser gene- 
ralizada para R". Puesto que 


O (5) de 
Y 


podemos multiplicar ambos lados de la ecuación deseada por 


v 
para obtener la forma equivalente 
O des -A G) = det (5) 
y v v 


Estableceremos esta ecuación verificando que las tres condiciones del 
Teorema 4.2 se satisfacen por la función 


O) 


(a) Principiaremos demostrando que 


=) 


Obsérvese que esta conclusión es inmediata si à = 0 puesto que 


¡OS 


Supóngase entonces que A 4 0. Considerando a Av como la base del para- 
lelogramo determinado por u y Av, vemos que 


A o = base x altura = | A ¡(longitud de v) (altura) = | A]: A (5) 


puesto que la altura A del paralelogramo determinado por u y Av, es la 
misma que la del paralelogramo determinado por u y v. (Véase Fig. 4.5.) 
De aquí que 


(a) o) 6) rt 


| 
> 
O 
ATN 
< £ 
S 
> 
AS 
< = 
s 
ll 
~ 
o 
PES 
< 2 
N_ 
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7) Au 


figura 4.5 


Un argumento semejante muestra que 


42) 0247) 


Demostraremos a continuación que 


u p.s fu 
s(a bw) =b 169 


para toda u, w €R? y todo número real a y b. Obsérvese que debido a 
que los paralelogramos determinados por u y w y por u y u + w tienen 
una base común u y la misma altura (véase Fig. 4.6), 


Si a = 0, entonces 


de acuerdo con el primer párrafo de la parte (a). De lo contrario, si 
a +0, entonces 


u u 
u = a: b = : b = . u 
asp) ofarba) eat) 30) 


Y así se obtiene la condición deseada en ambos casos. 
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Ahora podremos demostrar que 


A as 


para toda u, vı, vz €R*. Como el resultado es inmediato si u = 0, supon- 
dremos que u +0. Tómese cualquier vector w €R? tal que (u, w} sea 
linealmente independiente. Entonces, para vectores cualesquiera v, 
va E R?, existen escalares a; y b; tales que v; = ayu + b;w(i = 1, 2). En- 
tonces 


u m u E u 
è A $ E e (a ait (bit bw) Ponu o) 


u u _ u u 
=ô Gi + bw) T (ai -+ bo) ô (+) Te ) 


Un argumento semejante muestra que 


OO 


para todo u,, Uz, v ER. 
(b) Como 


a (2) mo=o(2)a(o 


para toda u ER?. 
(c) Como el paralelogramo definido por e, y e, es el cuadrado uni- 


tario, 
(2) i - eS i e 
€o €2 €e 


Por tanto, $ satisface las tres condiciones del Teorema 4.2 y 3 = det. 
Así, el área del paralelogramo determinado por u y v es igual a 


o(2) (i) 


Entonces, por ejemplo, se ve que el área del paralelogramo determi- 
nado por u = (—1, 5) y v = (4, —2) es 


u zl SAR 
der (+) der 7 2). 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son falsas o verdaderas. 


(a) El determinante de una matriz de 2 x 2 es una función lineal de 
cada renglón de la matriz cuando el otro renglón se mantiene fijo. 
(b) SiZ es la matriz identidad de 2 x 2, entonces det(1) = 0. 
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(c) Si ambos renglones de una matriz A de 2 x 2 son idénticos, enton- 
ces det(A) = 0. 

(d) Si u y v son vectores en R? que parten del origen, entonces el área del 
paralelogramo que tiene a u y v como lados adyacentes es 


det (+). 


(e) Un sistema coordenado (u, v} es derecho si y sólo si su orientación 
es 1. 
(f) El determinante es una transformación lineal de M+,.(F') en F. 


Calcular los determinantes de los siguientes elementos de M,,2(R): 
(a) [6 -3 (b) /—5 2 (c) /8 0 
2 4 6 1 3 =1 
Calcular los determinantes de los siguientes elementos de Mzx2(C): 
(a) /—-1 +i all (b) 5— 2i 6+4i (c) f2i 3 
( 3+2i 2- 3i HE Ti 4 6i 
Para cada uno de los siguientes pares de vectores u y v en R?, calcule el 
área del paralelogramo determinado por u y v. 
(a) u= (3, —2) y v = (2, 5) 
(b) u= (1,3) y v= (-3, 1) 
(c) u= (4, —1) y v= (-6, —2) 
(d) u= (3,4) y v= (Q, —6) 


Demostrar que si B es la matriz obtenida al intercambiar los renglones de 
una matriz A de 2 x 2, entonces det(B) = —det(4). 


Demostrar que para cualquier A EM.,2(F), det(4*) = det(4). 


Demostrar que si A es una matriz triangular de 2 x 2, entonces el deter- 
minante de A es igual al producto de los elementos de 4 situados en la 
diagonal. 


Demostrar que para cualesquiera A, BEM»,»(F), det(AB) = det(A) * 
det(B). 


La adjunta clásica de una matriz A de 2 x 2 es la matriz 


. Aso — AÁ o 

dj A = a = 

eR (Ea o) 
Demostrar que la adjunta clásica de una matriz posee las siguientes pro- 
piedades: 
(a) (adj 4)A = A(adj 4) = [det(4)1/. 
(b) det(adj A) = det(A). 
(c) adj 4t = (adj A)’. 
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10. 


1. 


4.2 
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Utilizando al Ejercicio 9(a), demostrar que una matriz A de 2 x 2 es 
invertible si y sólo si det(4) 40, y que en este caso A”? = [det(A)]” 
x (adj 4). 


Demostrar que 


o(y)=1 


si y sólo si la base ordenada (u, v} para R? forma un sistema coordenado 
derecho. Sugerencia: Recordar la definición de una rotación dada en el 
Ejemplo 3 de la Sección 2.1. 


DETERMINANTES DE ORDEN n 


Hemos visto en el Teorema 4.2 que el determinante de una matriz de 
2 x 2 se caracteriza totalmente por tres propiedades. Definiremos pronto 
el determinante de una matriz de n x n en términos de esas propiedades, 
pero primero necesitaremos de algunos resultados preliminares. Para co- 
menzar definiremos la primera de las condiciones que caracterizaron al 
determinante de una matriz de 2 x 2. 


Definición. Una función 8: Mnaxn(F) > F se dice que es una función n-lineal 


si 3 es una función lineal de cada renglón de una matriz de n x n cuando 
los restantes n — 1 renglones se mantienen fijos, esto es, si 


A, A, A, 
cA; +A¡|=c-Ó A; |+ ôl A; ¿para i = 1,2,...,n 


A, A, A, 


siempre y cuando 
A, 
cA; + Ai 
A, 


sea un elemento de Ma 1 (F). 
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Ejemplo 2. El Teorema 4.1 muestra que det: M,,.»(F) >F definido 
por det(4) = A¡¡4z2 — Ar: A2, es una función 2-lineal. 


Ejemplo 3. La función 8: Maxn(F)->F definida por 38(4) = 0 para 
toda A € Maxn(F) es una función n-lineal. 


Ejemplo 4. La función 8: Maxn(F)— F definida mediante 8(4) = 
Asj¡Azj ... An; (esto es 8(A) es igual al producto de todos los elementos 
de la j-ésima columna de 4) es una función n-lineal para cada ¡(1 <j < n) 
puesto que 


A, 
CA, + Ai |= Ai te Aun Ac Ay + Aida os tt An 


A, 
z c(A;, e.. Ayt Aj) T (As, ad Ac AyÁao3 Ai An) 
Á; As 


= C» Ái + A, . 
A, An 
Ejemplo 5. La función 3: Mnxaı(F) ->F definida mediante 8(4) = 
A A22 ... Ann (esto es, 8(4) es igual al producto de los elementos de A 


ubicados sobre la diagonal) es una función n-lineal. 


Ejemplo 6. La función 8: M,:n(F) >F definida por 8(4) = tr(4) 
no es-una función n-lineal. 


Nuestro siguiente resultado muestra que las funciones n-lineales pue- 
den combinarse para producir otras funciones n-lineales. 


Teorema 4.3. Una combinación lineal de dos funciones n-lineales es una fun- 
ción n-lineal (donde la suma y la multiplicación por escalares son como se 
definieron en el Ejemplo 3 de la Sección 1.2). 
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DEMOSTRACIÓN. Sean 8, y 3, funciones n-lineales y sean a y b escalares. 
Si 8 es la combinación lineal $ = a8, + bê, entonces 


Á; Á; dı 


ô CA, + A; TE aô, CA, + A; + b.0, CA, + A; 


= C a:0, Ái -+ b.0, Ái + a:0, A; + b:0, A; 


Á; A; 
= c+0| A, | +4 4; para toda i 1<i<mn. 
An An 


Entonces $ es una función n-lineal. W 


Corolario. Cualquier combinación lineal de funciones n-lineales es una función 
n- lineal. 


DEMOSTRACIÓN. Ejercicio. 


La siguiente definición hace mención de la segunda de las tres propie- 
dades que caracterizaron al determinante de una matriz de 2 x 2. 
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Definición. Se dice que una función 8 n-lineal es alternante si S(A) = 0 siem- 
pre que dos renglones adyacentes sean idénticos. 


Ejemplo 7. De las tres funciones n-lineales dadas en los Ejemplos 3, 
4 y 5 sólo la primera de ellas es alternante. 


El siguiente resultado muestra que la definición anterior es más pode- 
rosa de lo que parece. En particular, no hay necesidad de que los 
renglones en la definición se supongan adyacentes. 


Teorema 4.4. Sea 8: Manxa (F) > F una función n-lineal alternante. Entonces 
son ciertas las siguientes expresiones: 


(a) Si B se obtiene al intercambiar cualquier par de renglones en 


una matriz A de n x n, entonces 8(B) = —S8(A). 
(b) Si dos renglones de una matriz de n x n son idénticos, entonces 
(A) =0. 


DEMOSTRACIÓN. Demostraremos primero que si B se obtiene al intercam- 
biar cualquier par de renglones adyacentes de A entonces 38(B) = —5(4). 
Supóngase que B se obtiene al intercambiar los renglones ¡ e i + 1 de 


A, : A, 
A A; 
A=|"" |; entonces B = Te 
Ai Ái 
An An 
Ahora bien 
Á; Á; A; 
S A, + Ass qn Ai + Ass 
A; + Ass: A; + Ass A; -+ AÅi+ı 
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2 A; de A; de As de Ass 
Á, Ai Á, Ás+ 
A, A, A, A, 


0 + Ó(4) + ôB) + 0 


porque $ es una función n-lineal alternante. Así, 3(B) = —8(4). 
Ahora supóngase que B se obtiene de A intercambiando los renglones 
i y į donde i < j. Comenzando con los renglones i e i + 1, intercambia- 
mos sucesivamente los renglones de A hasta que éstos tienen el orden 
siguiente: 
Ar Ai Anuy RG An Aj aey An 


En total, se requieren j — i intercambios para producir este orden. Ahora 
intercámbiese sucesivamente A, con el renglón anterior hasta que los 
renglones tengan el orden siguiente: 


Ax, e.. Ai-i Áj, Ain, s... 9 Aj, Ás, Aji e.. 9 Án. 


Este proceso requiere de j — i — 1 intercambios de renglones adyacentes 
y produce la matriz B. De aquí, en virtud del primer párrafo de la demos- 
tración, vemos que 


8(B) = (2D) 1) 3(4) = (- 139492 8(4) = —8(4A). 


Resta demostrar que si dos renglones de A son idénticos, por ejemplo 
i yj (i< j), entonces 8(4) = 0. Si j= i + 1, entonces dos renglones ad- 
yacentes de A son idénticos y por hipótesis 8(4) = 0. Si j > ¡+ 1, inter- 
cámbiense los renglones ¡+ 1 y j para obtener una matriz B con dos 
renglones adyacentes iguales. Entonces 8(B) = 0, pero como 3(B) = 
—8(A) de acuerdo con el segundo párrafo de la demostración, se tiene 
que 3(4) = 0. De este modo 3 satisface las condiciones (a) y (b). MW 


Estamos preparados ahora para definir un determinante en Mn (F). 
Obsérvese que el determinante se define en términos de las tres propieda- 
des del Teorema 4.2 que caracterizan al determinante de una matriz de 
2x2. 


Definición. Un determinante en Maxn(F) es una función alternante n-lineal 


8: Maxa (F) >F tal que 8(1I) = 1. 


Un ejemplo sencillo de determinante puede darse en M,,,(F), para la 
función 8: Mıxı(F) >F definida por 8(4) = A,, (el único elemento 
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de A), que claramente satisface los requisitos de esta definición. Mas aún, 
el Teorema 4.1 muestra que al definir el determinante de una matriz A 
de 2 x 2 como A,A: — 41242, se obtiene un determinante en M22(F) 
en el sentido de la definición anterior. Nuestro siguiente resultado nos 
autoriza a definir un determinante en Mnxn(F) por inducción para cual- 
quier n > 3. 


Teorema 4.5. Sea 8 una función n-lineal alternante en Maxn(F). Para cada 
matriz A de (n + 1) x (n +1) y para cada j(l <j <n + 1), se define 


exa) = E OMA As), 


donde A;,, es la matriz-de n x n obtenida a partir de A eliminando el 
i-ésimo renglón y la j-ésima columna. Entonces €; es una función (n + 
1)-lineal alternante en las matrices de (n + 1) x (n + 1) con elementos 
de F. 


DEMOSTRACIÓN. Como 4; se obtiene a partir de Æ al suprimir el ¡-ésimo 
renglón y la j-ésima columna, 8(4:;) es independiente del ¡-ésimo ren- 
glón de A. Entonces, como ê es una función n-lineal 3(4;;) es una función 
lineal de cada renglón de A a excepción del renglón i. Por tanto As: S(A¡j) 
es una función (n + 1)-lineal de las matrices de (n + 1) x (n+ 1) con 
elementos de F. Entonces, como 


n+1 
Es(4) = Y (21) Ai: 8 (Ai) 
í=1 
es una combinación lineal de las funciones (n + 1)-lineales Aj: S(A;;), 
€; es una función (n + 1)-lineal en virtud del corolario del Teore- 
ma 4.3. 

Demostraremos ahora que €; es alternante. Supóngase que Á es una 
matriz de (n + 1) x (n+ 1) en la que los renglones k y k +1 son 
idénticos. Entonces 4;; tiene dos renglones idénticos siempre que ¡Ake 
¡+k + 1. Así 8(4;,) = 0 siempre que i Æ k e ik + 1 y entonces 

E;l(A) = (1) Ar (Ari) + (—1) EVA n SA 4) - 
Pero como los renglones k y k + 1 de A son iguales, Ár; = Aam; Y 


Ar = Å amj. De aquí que E€;(4) = 0, lo que demuestra que €; es al- 
ternante. W 


Corolario 1. Sean 3 y E; como en el enunciado del Teorema 4.5. Si $ es un 
determinante en Masn (FE), entonces €; es un determinante en las matrices 
de (n+ 1) x (n + 1) con elementos de F. 


DEMOSTRACIÓN. Sea I la matriz identidad de (n + 1) x (n + 1) y sea 
7,, la matriz de n xX n obtenida a partir de Z al suprimir el renglón i y 


202 Determinantes 


la columna j. Entonces 1;; es la matriz identidad de n x n. Como 1;¡¡=0 
si ije; = 1, tenemos 


ED = DAL) = (1:8) 
= 8(1),) =1 


debido a que 8 es un determinante en Mnxn (7). Entonces €; es un deter- 
minante en las matrices de (n + 1) x (n + 1) con elementos de F. MW 


Corolario 2. Existe un determinante en Man (F) para todo entero positivo n. 


DEMOSTRACIÓN. La demostración será por inducción sobre n. Si n = 1, 
la función det: M,,.(F) > F definida mediante det(4) = A,, es un de- 
terminante en M,.,(F). Supóngase que existe un determinante 8 en 
Mnxn(F). Entonces para alguna ¡(1<j<n=+ 1), la función €; defini- 
da en el Teorema 4.5 es un determinante en las matrices de (n+ 0 >x 
(n + 1) con elementos de F. Esto completa la inducción. MW 


Definiciones. Si 3 es un determinante en M,, .. (F ), entonces el determinante 
n+1 
EA) = Y —D"Aj:ó(A,) 


definido en el Teorema 4.5 se llama la expansión de A a lo largo de la 


j-ésima columna. El escalar (—D9.S(A,) se llama el cofactor de A,, 
(con respecto al determinante 8). 


Ejemplo 8. Sea A el siguiente elemento de M,,,(F): 


1 ES: 
4 5 6l. 
789 
Los cofactores de A12, A2: y As: son, respectivamente, 
1) det 9)= (—-D(4:9- 6:7) = 6, 


13% det (3 9) = I9 = 347) == T2, 


(= de 5) = (-1)(1:6- 3:4) = 6. 


Por tanto, la expansión de A sobre la segunda columna es 


E€ (4) = Ar2(6) + Az2(—12) + Azo( 6) 
=2:6 + 5(-12) + 8:6=0. 
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De la misma manera, los cofactores de A,:, A23 y Aza SON, respectivamente, 


e 4 51 _ e ENS 
(1) det (7 p) = 10408 gS; 


(=De de 5) = (-D0:8-2:7)=6, 


3+3 1 2 = . pol, . ==, == 
(-1) det (4 s)=10 a 


De aquí que la expansión de A a lo largo de la tercera columna es 


EStA) = Ars(—3) + Az(6) + Ass(—3) = 3(-3) + 6(6) + 


+ 9(-3) =0. 


Veremos en el Teorema 4.9 que la igualdad de E.(4) y Es(4) en 


el Ejemplo 8 no es coincidencia. De hecho, veremos que existe exactamen- 
te un determinante en Maxn(F). 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) 


(b) 
(c) 
(d) 


(e) 
(f) 


Un determinante en Maxa(F) es una función lineal de cada renglón 
de una matriz de n x n con elementos de F cuando el resto de los 
n — 1 renglones permanece fijo. 

Si 8 es un determinante y cualquier par de renglones de A son idén- 
ticos, entonces 8$(A) = 0. 

Sea 8 un determinante. Si B es una matriz obtenida a partir de A 
intercambiando dos renglones cualesquiera entonces (4) = 8(B). 
La función 8: Mau.n(F) >F definida por 8(4) = 0 para toda 
A E Mauxn(F) es un determinante en Maxa (F). 

Para cualquier n > 2 existe un determinante en Man (1). 
Cualquier determinante 8: Mnxn(F) >F es lineal. 


Verificar que si A es la matriz de 3 x 3 del Ejemplo 8, entonces la expan- 
sión de A a lo largo de la primera columna es igual a cero. 


Evaluar el determinante de cada una de las siguientes matrices por expan- 
sión sobre la segunda y la tercera columna. (Cada matriz es un elemento de 


Maxs(C).) 


(a) 


—3 2 5 (b) 8 —4 0 
1 0 —1 0 6 -—3 
4 —6 7 —1 5 2 
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(c) /l 2 -5 (d /1+i —1 0 
6 -—4 3 2 3i 4i 
0 1 1 0 2-i —1+2 


¿Cuáles de las siguientes funciones 8: Msx3(F) —> F son funciones 3-linea- 
les? Justificar cada respuesta. 


(a) 38(4) = c, donde c es cualquier escalar no nulo 
(b)  5(4) = Az» 

(c)  8(4) = An Az Az2 

(d) 38(4) = Aj Azi4Azo 

(e) 3(4) = An Az Aso 

(1)  3(4) = A ALA? 


(g) S(A) = AnA — AAA so 


(a) Determinar todas las funciones 1-lineales 8: M,,,(F) >F. 
(b) Determinar todos los determinantes en M,,,(F). 


Demostrar la igualdad de las tres funciones €;: Mass (F) >F(¡= 1, 2, 3) 
definidas en el Teorema 4.5 para toda A € Msxs(F) por 
3 
ES (4) = > (-1)+14;5 det(4;,), 
i=1 
donde 4;, es la matriz de 2 x 2 obtenida a partir de A suprimiendo el 
renglón i y la columna j y det denota el determinante único en Mzx(F). 


Demostrar que el determinante único en M»,.2(F) es una función 2-lineal 
de las columnas de una matriz de 2 x 2 y que el determinante de una 
matriz de 2 x 2, en la que ambas columnas son idénticas, es cero. 


La demostración del Teorema 4.2 muestra que si 3 es una función 2-lineal 
ô: M2x2(F) > F, entonces 


(A) = AnA :8(1) + AnA i 3(M,) F 
+ An ÁAzo É 3(M:) + AA j S(As), 


donde I, M,, M: y M, son como en la demostración del teorema. Demos- 
trar que para escalares cualesquiera a, b, c, d€F la función 
E(A) = Ar Aza + Anab + Ar Aza0 + As Azid 


es 2-lineal. Entonces 8': Mz,2(F) > F es una función 2-lineal si y sólo si 
es de la forma anterior para algunos escalares a, b, c y d. 


Demostrar que si F no es un campo de característica dos (tal como se 
define en el Apéndice D), entonces la condición (a) del Teorema 4.4 im- 


Propiedades de los determinantes 205 


plica la condición (b) del mismo. Sin embargo, el resultado no es verídico 
en campos arbitrarios. 


10. Demostrar el corolario del Teorema 4.3. 


4.3 PROPIEDADES DE LOS DETERMINANTES 


Existen varias propiedades importantes que son de gran utilidad al evaluar 
un determinante de una matriz dada. Estas se resumen en el siguiente 
teorema. 


Teorema 4.6. Cualquier determinante 8 en M,,n(F) tiene las siguientes pro- 
piedades: 


(a) Si B es una matriz obtenida a partir de A al multiplicar cada 
elemento de un mismo renglón de A por un escalar c, entonces 
(B) =c:5(A). 

(b) Si dos renglones de A son idénticos, entonces S(A) = 0. 

(c) Si B es una matriz obtenida a partir de A intercambiando dos 
renglones, entonces S(B) = —8(A). 

(d) Si un renglón de A consta totalmente de elementos nulos, en- 
tonces S(A) = 0. 

(e) SiB es una matriz obtenida a partir de A al sumar un múltiplo 
del renglón i al renglón j(i +3), entonces 3(B) = 5(A). 


DEMOSTRACIÓN. La propiedad (a) es una consecuencia del hecho de que 
3 es una función n-lineal, mientras que las propiedades (b) y (c) son 
consecuencias del Teorema 4.4. 


(d) Supóngase que A;, el renglón i de A, consta totalmente de ele- 
mentos nulos. Entonces 


A, A, 
ôA) = Ñ 04, |= 0-8 A, | =0. 


An A, 
(e) Sea B obtenida a partir de A € Maxn(F) sumando c veces el ren- 


glón i al renglón j. Supóngase por razones de argumento que i< j. Por 
tanto, si 
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A; A, 
Ai Ái 
A=| - |, entonces B= i 
A; CA, + 4; 
A, A, 
Y así 
Á; Á 
Ái Ái 
ôB) =c-A - | +0] - |=c-0 + ôA) = ôA) 

Ái Á; 

A, A, 


por la n-linealidad de 8 y por la propiedad anterior (b). W 


Obsérvese que las propiedades (a), (c) y (e) del Teorema 4.6 mues- 
tran cómo cambia el determinante de una matriz cuando se realiza en la 
matriz una operación elemental en los renglones. Podemos reformular estas 
propiedades en términos de matrices elementales de la manera siguiente. 


Corolario. Sean E,, E. y E, matrices elementales en Manxa (F) respectivamente 
de los tipos 1, 2 y 3. Si E. se obtiene multiplicando un renglón de 1 por 
el escalar no nulo c, entonces para cualquier determinante 8 en Manx, (E), 
3(E,) = —1, 8(E,) = c, y 8E,) = 1. 


Este corolario es uno de los ingredientes clave de la demostración de 
la unicidad de un determinante en M,,.(F). Demostraremos ahora los dos 
teoremas restantes que serán necesarios para establecer la unicidad. Nues- 
tro primer resultado calcula el determinante de cualquier matriz no in- 
vertible. 


Teorema 4.7. Sea 8 un determinante en M,,..»(F) y sea A un elemento de 
Mixn (E) de rango menor que n. Entonces S8(A) = 0. 


Lema. 
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DEMOSTRACIÓN. Como rango(A) < n, los renglones de A son linealmen- 
te dependientes (Corolario 2 del Teorema 3.5). Por tanto existen escalares 
Ci, - . + , Cn, No todos cero, tales que c,A, + cA: + ... + CrAn = 0, don- 
de A,, A», ... , An son los renglones de A. Supóngase en favor del argu- 
mento que c, + 0; entonces 


A, + cc A, +... + O =0. 


Sea B la matriz obtenida a partir de A sumando al primer renglón el múl- 
tiplo c*c,A, del renglón i para toda i(i = 2,..., n). Entonces el primer 
renglón de B consta totalmente de elementos nulos, de modo que 3(B) = 0. 


Pero 38(B) = 38(4) de acuerdo con la propiedad (e) del Teorema 4.6. 
Por tanto 8(4) = 0. EW 


El siguiente resultado establece el hecho final necesario para demos- 
trar la unicidad de un determinante en M,.n(F), que un determinante se 
comporta adecuadamente respecto a la multiplicación matricial. Sin em- 
bargo, este teorema es de considerable importancia por su propio derecho. 
En especial su segundo corolario, que proporciona una prueba determi- 
nante para la invertibilidad de una matriz, será utilizado con frecuencia 
en los próximos capítulos. 


Si E es una matriz elemental de n x n con elementos de F y si 8 es un 
determinante en M,,.(F), entonces 3(EB) = 8(E) : 8(B) para cualquier 
B EM» xn (F). 


DEMOSTRACIÓN, Supóngase que al multiplicar por la izquierda por E se 
intercambian dos renglones de B. Entonces S(EB) = —3(B) de acuerdo 
con el Teorema 4.6(c). Pero 8(E) = —1 por el corolario al Teorema 4.6; 
entonces 3(EB) = 8(E) : 8(B). Demostraciones semejantes establecen el 
resultado para la multiplicación de un renglón de B por un escalar no nulo 
o para la suma de un múltiplo de un renglón a otro. W 


Teorema 4.8. Sea 8 un determinante en M,,."(F), y sean A y B elementos 


cualesquiera de M,,,(F). Entonces S(AB) = S(A) : (B). 


DEMOSTRACIÓN. Si rango(4) < n, entonces de acuerdo con el Teore- 
ma 3.6 rango(AB) < rango(4) <n. Por tanto por el Teorema 4.7 
S(AB) =0 y 8(4) =0. Y en este caso S(AB) = 3(4) : 3(B). 


Si rango(A)i= n, A es invertible y por tanto es el resultado del 
producto de matrices elementales (Corolario 3 del Teorema 3.5). Sea 
A = Em... E,, donde cada E; es una matriz elemental. Entonces por el 
lema tenemos 


S(AB) = 8(En ... EB) = 8(Em) 8 (Em ... EB)'= ... 
= 3(En)*...S(E,) :5(B) = (En ... E,):5(B) = 8(4) :5(B). E 
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Corolario 1. Sea 8 un determinante en Maxa (F), y sea A € Mnxn(F) invertible. 
Entonces S(A) 40 y 3(AT*) = TSC(A)]". 


DEMOSTRACIÓN. En virtud del Teorema 4.8 se tiene que 
S(A) : 8(A7?) = S(AA_A7) = 3(1,) = 1. 
De manera que 3(4) 40 y 8(471) = [8 (A). E 


Corolario 2. Sea 3 un determinante en Maxn(F) y sea AE Max (F). Entonces 
las siguientes condiciones son equivalentes: 


(a) S(A)=0. 
(b) A no es invertible. 
(c) rango(A) <n. 


DEMOSTRACIÓN. El corolario anterior muestra que si 8(A) = 0, enton- 
ces A no es invertible. De aquí que la condición (a) implica la condi- 
ción (b). 


El que la condición (b) implique la condición (c) se deriva de una 
observación previa en la página 146. 

Finalmente, el Teorema 4.7 muestra que la condición (c) implica la 
condición (a). MW 


Se demostró en los Teoremas 4.1 y 4.2 que existe exactamente un 
determinante en M2,»(F). Ahora podemos demostrar un resultado seme- 
jante para Man (F). 


Teorema 4.9. Existe exactamente un determinante en Ma xn (F). 


DEMOSTRACIÓN. La existencia de un determinante en Maxa (F) se demos- 
tró en el Corolario 2 del Teorema 4.5. 


Completaremos la demostración, estableciendo que si 8, y 8, son deter- 
minantes en Maxn(F), entonces 3, = 8,. Sea A una matriz arbitraria de 
n x n con elementos de F. Si rango(4) < n entonces 8 (4) = 8.(4) =0 
por el Corolario 2 del Teorema 4.8. Si rango(A) = n, entonces A es 
invertible y por tanto es el producto de matrices elementales (Corolario 3 
del Teorema 3.5). Sea A = Em ... E,, donde cada E, es una matriz ele- 
mental. Como 3,(E,) = 8,(E,) para cada i(1 <i <m) por el corolario 
al Teorema 4.6, 


S1(A) = 8,(Em ... E1) =8,(Em) ... 3,(E,) 
= (Em) ... 8:.(E,) = 82.(Em... E,) = 8.(4) 


por el Teorema 4.8. Por tanto 3, = 8,. | | 


De aquí en adelante denotaremos al único determinante en Ma xn (F) 
por det. 
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Corolario. Sea A € M,:n(F). Para toda ¡(1 <j<n) 


det(A) = X (—1)WA;,-det(A,,), 
i=1 - 

donde A;, es la matriz de (n — 1) x (n — 1) obtenida de A al suprimir 

el renglón i y la columna j. 


Así, el determinante de una matriz de n x n puede evaluarse por ex- 
pansión sobre cualquier columna; si n > 2 la expansión resultante conten- 
drá n determinantes de matrices de (n — 1) x (n — 1). El determinante 
de cada una de esas matrices de (n — 1) x (n — 1) puede expandirse 
sobre cualquier columna y este proceso puede continuar hasta que una 
expansión implique únicamente determinantes de matrices de 2 x 2, que 
pueden ser evaluados mediante la expresión det(A) = 41422 — Ar A»1. 

Obsérvese sin embargo que la evaluación de det(4;¡;) puede evitarse 
siempre que A;;= 0, pues el producto A;;:det(4,;) será cero indepen- 
dientemente del valor del determinante. Por tanto, es benéfico expandir 
sobre una columna que tenga tantos ceros como sea posible. Ilustraremos 
este procedimiento con dos ejemplos. 


Ejemplo 9. Sea A el siguiente elemento de M,,,(F): 


— o ox 
=>) 
pi pa pb AS 


1 
1 
0 
1 


Para minimizar el cálculo requerido para evaluar det(4), expandiremos 
sobre la segunda columna. Entonces 


det(4) = y (—1)*24,, -det(4,,) 


1.11 1 0 1 
=(—1)+2.1.detfo 1 1|+(=1)*2-0.det[O 1 1 
1.11 1 1 1l 


1 0 1 1 0 1 
+ (—1)3+2.0.det[1 1 1) +4 (2D)*2.1+det[ 1 1 ) 
1.11 0 1 1 
1.0 1 
=(—1):1:0+0+0+1+1.detl 1 1 1 
0 1 1 
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(La primera de las cuatro matrices de 3 x 3 tiene dos renglones idénticos, 
por lo que su determinante es cero.) Evaluaremos ahora el determinante 
que queda expandiendo sobre la primera columna. Entonces 


1 0 1 
det(4A) = det[ 1 1 1 
0 1 1 


1 1 0 1 
e — 1+1, . — 1 2+1.1.d t 
(—1) l def i + (—1) e b ,) 


¿yoo 1) 


= 1.1.0 + (—1)1(=D+0=1. 
Ahora sea B el siguiente elemento de Msxs(R): 


l —l 0 0 
2 0 -—3 1 
5 —4 0 2 
0 3 0 —1 
—9 8 0 0 


¡E o 


Expandiendo sucesivamente sobre la tercera, cuarta y tercera columnas 


vemos que 
l —1 0 0 
EA e 4 2 0 
det(B) = (— 1)2*2.(—3)-det e ica 
—9 8 0 0 
L =1 0 
= X(-—1)?**.4.detf 5 —4 2 
—9 8 0 


ll 


1] —]1 
—12.(—1)?*3.2.det 
(1) E 3) 


24[1-8 — (—1X(—9)] = 24—1) = —24. 


Il 


Como estos ejemplos lo sugieren, el proceso de cálculo de un deter- 
minante es a menudo tedioso aun cuando se encuentren presentes elementos 
nulos; sin elementos nulos la evaluación de un determinante por expan- 
sión sobre una columna es muy ineficiente. En vez de este procedimiento 
podemos utilizar la propiedad (e) del Teorema 4.6 para cambiar la 
matriz A en una matriz B que tenga el mismo determinante que Á y que 
tenga elementos nulos en una o más columnas. Este es en esencia el 
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mismo proceso que se utilizó para reducir A a la forma escalonada. A con- 
tinuación se tienen ejemplos de esta técnica. 


Ejemplo 10. Sea A el siguiente elemento de Mi, .(R): 
l —1 2 —1 
—3 4 1 —1 


2 —5 —3 8| 
—2 6 —4 1 


Entonces 
A, A; 
A 3A, + A 
det(4) = det| ° | = det La 
A; —24, + As 
A, 24, + 44 
Si or 
= det| 5 BR 10 = (—1)*1.1.detl -3 —7 10 
e 4 0-1 
0 4 0-1 
t7 4 z i 
= det] —2 0 6 | 4 y 
4 0 -—1 


= UMD) — 6-4] = —1(—22) = 154. 


Ejemplo 11. Sea A el siguiente elemento de M,,.¿(R): 


1 —1 2 1 
2 —1 —1 4 
—4 5 —10 —6| 
3 —2 10 —1 
Introduciremos elementos nulos mediante el uso del Teorema 4.6(e) de 
tal modo que A se transforme en una matriz triangular superior que tenga 
el mismo determinante que 4. El determinante de la matriz triangular 


superior se calculará entonces por expansiones sucesivas sobre la primera 
columna. 


l —1 2 l l —1 2 1 
2 —1 -—1 4 0 —5 2 
det(4) = det = det 
—4 5 —10 —6 0 =2 -2 
3 —2 10 —1 0 l 4 —4 
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l —1 2 1 1 —1 2 1 
0 —5 — 
= det zdal. i 2 
0 0 3 —4 0 0 3 —4 
0 0 9 —6 0 0 0 6 
— 2 
l-d le : 4|=1.1.4 h E 
= l.de == = 1. 1.de 0 6 
0 0 6 
= 1.1.3.6 = 18. 


Hasta ahora, el papel jugado por los renglones y columnas de una 
matriz en el estudio de los determinantes ha sido muy diferente —un deter- 
minante se definió como una función en Mnaxn(F) que satisface ciertas 
propiedades que involucran a los renglones de una matriz, mientras que la 
evaluación del determinante se lleva a cabo mediante la expansión sobre 
las columnas de la matriz. Estos papeles son reversibles y ahora verifica- 
remos este hecho demostrando que los determinantes de A y A* son 
iguales. (Como los renglones de A son las columnas de A' y viceversa, 
este resultado será suficiente para demostrar que los papeles desempe- 
ñados por los renglones y las columnas son intercambiables.) 


Teorema 4.10. Para cualquier matriz A de n x n det(A') = det(A). 


DEMOSTRACIÓN. Si A no es invertible, entonces rango(A) <n. Pero 
como rango(4*) = rango(A) (Corolario 2 del Teorema 3.5) se tiene que 
A! no es invertible, y entonces, en este caso, det(A) = 0 = det(4*). 


Si A es invertible, entonces A = Em ... E,, donde E,, ... , Em son 
matrices elementales. Como det(E!?) = det(E,) para cada i (véase el 
Ejercicio 5), tenemos que 


det(A4*) = det(E! ... El) = det(E;) ... det(E! ) 
=det(E,) ... det(Em) = det(Em) ... det(E,) 
= det(Em ... E,) = det(4). E 
Corolario. Cualquier argumento sobre determinantes que involucre a los renglo- 
nes de una matriz puede ser enunciado de nuevo en términos de las colum- 
nas de la matriz, y cualquier argumento que involucre a las columnas de 


una matriz puede ser enunciado de nuevo en términos de los renglones 
de la matriz. En particular, si A es una matriz de n x n, 


det(A) = X (—1)™A;;- det(Ãi;), 


j=1 
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donde A; es la matriz de (n— 1) x (n— 1) obtenida a partir de A 
al suprimir el renglón i y la columna j. 


Ejemplo 12. Sea A el siguiente elemento de M,,(R): 


En este caso el cálculo requerido para evaluar det(A) puede ser minimi- 
zado al expandir sobre el tercer renglón, y entonces 


4 —3 6 0 —15 10 
det(A) = —5 det] —2 1 4|=-5 «o 7 2 
1 3 —1 1 3 —1 
—15 
=-—5 det e = —5[((—15).2 — 10.7] = 500. 


Nuestro resultado final nos permite evaluar fácilmente el determinante 
de una matriz triangular. Este resultado hace de la técnica utilizada en 
el Ejemplo 11 un método muy eficiente para evaluar determinantes. 


Teorema 4.11. Si A es una matriz triangular de n x n, entonces det(A) = 
AsAz: ... Ann; esto es, el determinante de A es el producto de los ele- 
mentos de A ubicados en la diagonal. 


DEMOSTRACIÓN. Sea Æ una matriz triangular superior de n x n. La de- 
mostración se hace por inducción sobre n. Si n = 2, entonces A tiene la 


forma 
_ (An Az 
Ai (o a) 
y entonces det(4) = AnA — A120 = A¡¡A>», lo que demuestra el teo- 


rema para matrices triangulares superiores si n= 2. 


Supóngase que el teorema es cierto para matrices triangulares supe- 
riores de (n— 1) x (n— 1) y sea A una matriz triangular superior de 
n x n. Entonces A tiene la forma 

Ái Aiz AV Aia- Ain 
0 Ar SESS Ázin-1) Arn 


0 0 ..- 0 Ann 
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Al expandir sobre la primera columna, vemos que 
Ázz E Áza-10 Aan 


det(4) = A, , -det] - 


O --- 0 Ann 
mE A¡¡ (Az, EOS Ann) 


por la hipótesis de inducción. Esto completa la inducción y demuestra el 
teorema para matrices triangulares superiores. 

Si A es una matriz triangular inferior, entonces A* es una matriz trian- 
gular superior. Por tanto, la primera parte de esta demostración y el 
Teorema 4.10 implican que 


det(4) = det(4*) = (4*)11 ... (A )nmn = An... An M 


Tal como en la Sección 4.1, es posible interpretar geométricamente el 
determinante de un elemento A en Maxan(R). Si A,, ... , An son los n 
renglones de 4, podemos interpretar 


A, 
det 
An 
como el volumen n-dimensional (la generalización del área en R? y del 
volumen en R?) del paralelepípedo que tiene a los vectores A,, ... , Án 


como aristas adyacentes. (Para una demostración de este resultado véase 
a Serge Lang, Análisis I, Addison-Wesley, 1968, pp. 413-418.) 

En nuestra anterior exposición del significado geométrico del determi- 
nante formado a partir de los vectores en una base ordenada para R?, 
vimos también que este determinante es positivo si y sólo si la base 
induce un sistema coordenado derecho. Una aseveración similar es verí- 
dica en R". Específicamente, si y es cualquier base ordenada para R" y 8 
es la ordenada estándar para R”, entonces y induce un sistema coordenado 
derecho si y sólo si det(Q) > 0, donde Q es la matriz de cambio de 
coordenadas que permite pasar de coordenadas de y a coordenadas de g. 
Entonces, por ejemplo, 


1 1 0 
y=4| 11 [—1] [0 
0 O, 1 


induce un sistema coordinado izquierdo en R* puesto que 
1 1 0 


det| 1 —1 0|='"-2=<0, 
0 O 1 
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mientras que 


1 —2 0 
y =41 21], 11, [0 
0 0 1 


induce un sistema coordenado derecho en R? porque 


1 —2 0 
det| 2 1 0|=5>0. 
0 0 1 


Más generalmente, si 8 y y son dos bases ordenadas cualesquiera de R”, 
entonces los sistemas coordenados inducidos por f y y tienen la misma 
orientación (ambos derechos o ambos izquierdos) si y sólo si det(Q) > 0, 
donde Q es la matriz de cambio de coordenadas que permite el paso de 
las coordenadas de y a las de £. 


EJERCICIOS 


1. 


2. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) 
(b) 


(c) 
(d) 


(e) 
(£) 
(g) 
(h) 
(i) 


(j) 
(k) 


Si dos renglones de A son idénticos, entonces det(A) = 0. 

Si B es una matriz obtenida a partir de A mediante el intercambio 
de dos renglones, entonces det(B) = —det(4). 

Si B es una matriz obtenida a partir de A multiplicando un renglón 
de A por un escalar c, entonces det(4) = det(B). 

Si B es una matriz obtenida a partir de A sumando un múltiplo esca- 
lar del renglón i al renglón j(i j), entonces det(4) = det(B). 

Si E es una matriz elemental, entonces det(E) = +1. 

Si A, BEMuxn(F), entonces det(AB) = det(4) : det(B). 

Una matriz M es invertible si y sólo si det(M) = 0. 

Una matriz M € Manx (F) tiene rango n si y sólo si det(M) 40. 

El determinante de una matriz puede ser evaluado por expansión so- 
bre cualquier renglón o columna. 

det(A!) = —det(4). 

El determinante de una matriz diagonal es igual al producto de los 
elementos de la diagonal. 


Evaluar cada uno de los siguientes determinantes por el método que se 
indica. 


(a) 


Por expansión sobre la segunda columna 


2 —1 4 
3 6 1 
—1 2 3 
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(b) Por expansión sobre el primer renglón 
—3 1 2 
1 —1 4 
5 6 1 
(c) Por expansión sobre la tercera columna 
1 2 1 l 
—i 1 0 1 
200 —i 
0 1 1 1 
(d) Por expansión sobre el cuarto renglón 
l 2 0 -—1 
1 —1 0 2 
l 0 1 0 
0 1 2 1 


Evaluar los determinantes de las matrices siguientes por cualquier método 
permitido. En cada caso C es el campo de escalares. 


(a) / 4-7 3 (b) /9 0.0 (o) /4 —5 2 

1 2-1 480 2 81 

-3 4 5 327 6 —1 3 

(d) /—2+i —1 ši © /1 211 

a; -3 0 2 1 

3 342i —2 > 

4i 0O 1+i T 3 4 

-1 6 3 3 

© /2 0-13 (E) -1+3 2i 6 o0 
4 3 5] 4 0O 3+i di 
1 6 02 0 1-28 0 2-i¡ 
0-5 37 2i 5 0 1+i 


Demostrar que una matriz triangular de n x n es invertible si y sólo si 
en la diagonal no se encuentra ningún cero. 


Completar la demostración del Teorema 4.10 demostrando que si E es una 


matriz elemental, entonces det(E*) = det(E). Sugerencia: 
triz elemental del mismo tipo que E. 


Et es una ma- 


Demostrar que si A €Mnxa (F), entonces det(cA) = crdet(A) para cual- 


quier escalar c. 


9.1 


10. 


11. 


12. 
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(a) Una matriz B en M,.n(R) se llama ortogonal si BB! = I. Demos- 
trar que si B es ortogonal, entonces det(B) = EL, 

(b) Una matriz B en Maxa(C) se llama unitaria si BB* = I donde 
(B*)¡, = By, el complejo conjugado de B;;. Demostrar que si B 
es unitaria entonces | det(B) |=1. Sugerencia: Demostrar primero 
que det(B) = det(B). 


Una matriz B en M,..(C) se llama antisimétrica si B! = —B. Demostrar 
que si B € Maxa (C) es antisimétrica y n es impar, entonces det(B) = O. 


Sea A EMnmau(F), y sea m tal que 1 < m < n. Sean 
Ao AS Abad tt, A 
E A | pe l ; 
EET E A ea a r 
Amivimio 000 Aiman 
hija ls ol, 
Ásim+n + Anp 


y O sea la matriz nula de (n— m) x m. A se puede escribir simbólica- 


mente como 
= B, B, 
A = ( a 3.) 
Demostrar que det(4) = det(B,) * det(B3). 


Sea 8 = {xı, - - - ,Xn} un subconjunto de F° que contiene n vectores diferen- 
tes, y sea B el elemento de Maxn(F) cuya j-ésima columna es el vector xj. 
Demostrar que 8 es una base para F" si y sólo si det(B) +0. 


Complete la demostración del lema del Teorema 4.8. 


Recuérdese la transformación lineal T: P,(F) = FP" definida en el Ejerci- 
cio 20 de la Sección 2.4 por T(f) = (f(Co), -.- > f(c,)), donde Co, ... » Cn 
son elementos distintos de un campo infinito F. Sea 8 = {1, x, x”, ..., x”} 
una base ordenada de P,(F) y y la base ordenada normal para pz, 


(a) Calcular M = [T]; . Una matriz que tiene la forma de M se llama ma- 
triz de Vandermonde. 

(b) Demostrar que det(M) 0 utilizando el Ejercicio 20 de la Sec- 
ción 2.4. 
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(c) Demostrar que 
de(M)= II] (c,—c), 
0OSI<J<n 


el producto de todos los términos de la forma c; — c; para 0< is 
j <n. 


Sea A €Muxn(F) no nula. Para toda m(1 < m <n) una submatriz de 
m x m se obtiene de A suprimiendo n — m renglones y n — m columnas 
cualesquiera de A. Sea k(1 < k < n) el mayor entero tal que alguna sub- 
matriz de k Xx k de A tiene un determinante no nulo. Demostrar que 
rango(A) = k. 


Utilizar los resultados de esta sección para demostrar el Ejercicio 8 de la 
Sección 2.4: Si A y B son matrices de m x n tales que AB = I„, entonces 
A es invertible (y por tanto B = A”). 


Demostrar que si Æ y B son matrices similares, entonces det(4) = det(B). 


LA ADJUNTA CLASICA Y LA REGLA DE CRAMER 


En esta sección definiremos la adjunta clásica de una matriz de n x n y 
la utilizaremos para calcular la inversa de una matriz. También obtendre- 
mos la regla de Cramer, la cual permite utilizar determinantes para resolver 
un sistema de ecuaciones lineales cuando éste tenga una matriz de coefi- 
cientes invertible. Nuestra herramienta principal será el siguiente teorema 
que muestra las consecuencias de una expansión de una matriz por ele- 
mentos de una columna y cofactores. 


Teorema 4.12. Sea A una matriz de n x n'y sea ci; el cofactor de A;;(1 < i, 


j < n). Entonces 
> Aj; * Cik = Ô jk ý det(A), 
i=1 


donde 8x es la delta de Kronecker. 


DEMOSTRACIÓN. Si j= k, la ecuación se obtiene a partir del corolario 
del Teorema 4.9. Supóngase que j -4k y sea B la matriz que tiene todas 
sus columnas idénticas a las columnas correspondientes de A excepto la 
columna k-ésima, B*, que es idéntica a la columna j de A. Entonces B* = 
B! = Al, y el cofactor de Bix es cix. Ahora bien, det(B) = 0 puesto que 
dos columnas de B son idénticas; pero, expandiendo B sobre la columna k, 
tenemos también 


det(B) = 5 BikCik = Ss A ijCik- 


i=1 i=i 
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Y por tanto 
D Aic = 0 sij<k. E 
i=1 


Corolario 1. Si A y ci; son como en el enunciado del Teorema 4.12, entonces 


5 Aja; = Six det(A). 


J=1 

DEMOSTRACIÓN. Ejercicio. 
Definición. Sea A una matriz de n x n. La matriz de n x n adj(A) cuyo ele- 
mento del renglón i y columna j es el cofactor de A;; se llama la adjunta 


clásica de A. (Entonces adj A = Ct, donde C,; es el cofactor de A;;.) 


Ejemplo 13. Sean A y B los siguientes elementos de Ma, ¿(R): 


1 2 3 1 3 —1 
A=|1 0 l] and B=|-1 -4 2]. 

1 1 —1 2 0 1 

Entonces 

—1 2 nz —1 5 2 
adj A = S —4 lj =| 2 —4 21, 

2 2 —2 1 l —2 

y —4 5 8\z —4 —3 2 
adj B = | —3 3 6|] = 5 3 —l1]. 

2 —1 -—1 8 6 —1 


Corolario 2. Para toda matriz A de n x n (adj AJA = [det(A)]I. 


DEMOSTRACIÓN. Sea A €Mnxn(F), y sea c;; el cofactor de A;;. Entonces 
(adj A)ji = Ci; y por tanto, el elemento de (adj A)A para el j-ésimo 
renglón y k-ésima columna es 


Y (adj A )jiAir = A cij Aix = 854 det(A) 


í=1 i=1 


por el Corolario 1. Así (adj A)A = [det(4)1/. MW 


Ejemplo 14. Sea A tal como en el Ejemplo 13. Al expandir A sobre 
el segundo renglón, vemos que 


det(4) = (-1) 1: (2(-1) - 3:11 + (-D):1:(1:1-2:1)=6,. 
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Y 1. 5 A12 23 /600 
(addiaa=| 2 -4 210 1|=l0 60 
1 1 —2/\ 1-1) W06 

= [det(Ay]7. 


De una manera análoga, si B es como en el Ejemplo 13, entonces al ex- 
pandir B sobre el tercer renglón vemos que 


det(B) = 2[3 :2 — (—1)(—4)] + 1[1(-4) — 3(-1)] = 3. 


Más aún, 
—4 —3 2 1 3 —i 300 
(adi BBB =| 5 3 —1l-1 -—4 2|=j0 3 0 
8 6 —1 2 0 1 0.03 
= [det(B)]Z. 


Corolario 3. Si A es una matriz invertible, entonces 
A71 = [det(A)]7 (adj A). 


DEMOSTRACIÓN. Si A es invertible, entonces det(4) 40 (Corolario 1 
del Teorema 4.8). Ahora bien, (adj A) 4 = [det(A)]7 por el Corolario 2 y 
por tanto [det(A)]*(adj 4)A =I. Y entonces [det(A)]*(adj A) = 
A. BM 


Ejemplo 15. Continuando con el Ejemplo 14, tenemos 


—1 5 2 —+ 2 4 


47! = [det(A] edj 4) = 4 E E E E E 
1o12 4 4, 

y 
a e or g 
B"! = [det(B)]- "(adj B) = -4 s a aael a 
8 6 -1 p sl 


Concluiremos esta sección con una exposición de la regla de Cramer, 
que proporciona un método interesante para resolver ecuaciones matri- 
ciales de la forma AX = B, donde A es una matriz invertible. Este método, 
sin embargo, es extremadamente ineficiente, puesto que si Æ es una ma- 
triz de n x n, la solución del sistema AX = B por medio de la regla de 
Cramer requiere de la evaluación de n + 1 determinantes de matrices 
de nx n. (Por comparación, el método de solución presentado en la 
Sección 3.4 es un modo más eficiente para resolver tales sistemas. Por lo 
tanto, la regla de Cramer es más bien de interés teórico y estético, que 
práctico.) 
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Teorema 4.13. (Regla de Cramer.) Sea AX = B la ecuación matricial de un 
sistema de n ecuaciones lineales con n incógnitas, donde X = (X,, ..., 
Xa)t y B= (b,,..., b,)!. Si det(A) 40 el sistema tiene una solución 
única y para toda i(1 <i< n) 


Xx; = [det(A)J” : detr(M,), 
donde M, es la matriz de n x n obtenida a partir de A reemplazando la 


i-ésima columna de A por B. 


DEMOSTRACIÓN. Por el Corolario 2 del Teorema 4.8, det(A) +0 impli- 
ca que A es invertible. Por tanto, de acuerdo con el Teorema 3.9, la ecua- 
ción matricial AX = B tiene una solución única. Multiplicando esta 
ecuación por la izquierda por adj A y utilizando el Corolario 2 del Teo- 
rema 4.12 se tiene 


[det(A)1/X = (adj AJAX = (adj 4)B. 
Examinando las coordenadas ¡-ésimas de los vectores columna [det(4)] 
X = (adj A)B, puede verse que 
[det(4)]x; = X (adj 4) 550, = > cjb;, 
j=1 j=1 


donde c;; es el cofactor de A;;. Pero 
n 
Y cjib; 
j=1 
es la expansión de M; sobre la ¡-ésima columna; entonces 
n 
[det(4)]x; = X cjib; = det(M;), 
j= 


=1 


y consecuentemente 
x; = [det(A)]* : det(M;) para 1<i<n E 


Ejemplo 16. Utilizaremos la regla de Cramer para resolver la ecuación 
matricial AX = B, donde 
1 2 3 2 
A=|1 0 1 y B=]|3 
1 1 —1 1 
Primero, como se vio en el Ejemplo 14, det(4) = 6, por lo que se aplica 


la regla de Cramer. Si M; es la matriz obtenida a partir de A substituyendo 
la i-ésima columna de A por B, se tiene 
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2 2 3 
deti 3 0 1 
x, — deM) _ i 1 -—1 CA 
1! det(A) — det(A) 6 2 
1 2 3 
det|1 3 1 
x, — det(M)) _ 1 1 —1 O a 
2 det(A) — det(4) 6 $ 
y I 2 2 
deti 1 0 3 
x _det(M,) _ 1 1 1 a d 
> del A —  de(4) 672 


EJERCICIOS 
1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Si una matriz se expande sobre los elementos de una columna y los 
cofactores diferentes de una columna el, resultado es el determinante 
de la matriz. 

(b) Si A EMaxn(F), entonces (adj AJA = 1. 

(c) Todo sistema de n ecuaciones lineales con n incógnitas puede ser 
resuelto mediante la regla de Cramer. 

(d) Sea AX = B la forma matricial de un sistema de m ecuaciones lineales 
con n incógnitas, donde X = (xı, ..., xn)! Si det(4) 40 y si M; 
es la matriz obtenida a partir de A al reemplazar el renglón i de A 
por B*, entonces 


x; = [det(4)]” : det(M;). 


2. Encontrar la clásica adjunta de las siguientes matrices. 


(a) (b) /-4 0 0 
e n 02 0 
21 22 0 0 5 
(e) J/l—=i 0 0 (d) /3 6 7 
4 3i 0 0.4 8 
2i 1+4i —1 00 5 


4.5 
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(e) 7 1 4 (£) 3 2+i 0 
6-3 0 =I 0 i 
an g-e 0 1 3—2i 

(œ) /—1 2 5 (h) /40 0 
8 0 -3 040 
46 1 0.04 


Resolver los siguientes sistemas por medio de la regla de Cramer. 


(a) AXi t Gr9X2 = b, 2x, + x — 3x = 5 
aX T aX = ba, (b) X% — 2x + x= 10 
donde Qiiå22 T Ai2đ21 Æ O. 3x T Ax; z 2x3 E 0 
2x + X2 3x3 == 1 Xi TT X + 4x3 TE —4 
(c) A 2x + x= 0 (d) —8x, t 3x: + x= 8 
| ax, + Ax» = 2x3 FR —5 2x o X2 + X3 = 0 
x= Xx t 4x, = -2 BL t Ltr 4 
(e) —8x, + 3Xo + Xa = 0 (£) — 2x — Xz = 12 
2x — X + X3 = 6 X1 + 2x2 + X; = —8 


Demostrar que para cualquier Á CMaxn(F), det(adj A) = [det(A)]"”. 


Sea A una matriz triangular superior invertible de n x n. Demostrar que 
adj A es triangular superior y por tanto A” es triangular superior. Demostrar 
que resultados semejantes son ciertos si A es triangular inferior. 


Demostrar el Corolario 1 del Teorema 4.12. 


Demostrar que adj At = (adj A)”. 


RESUMEN —-CONCEPTOS IMPORTANTES 
SOBRE DETERMINANTES 


En esta sección resumiremos las propiedades importantes de los determi- 
nantes que nos serán necesarios para el resto del texto. Los resultados 
contenidos en esta sección fueron obtenidos en las Secciones 4.2 y 4.3; 
por tanto los conceptos presentados aquí serán enunciados sin demos- 
tración. 

El determinante de una matriz A de n x n con elementos de un cam- 
po F es un elemento de F, expresado como det(A), que puede ser 
calculado de la siguiente manera: 


1. Si A es de 1 x 1, entonces det(A) = A,,, el único elemento 
de A. 
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2. Si A es de 2 x 2, entonces det(A) = A1¡422 — Ar Az. Así, por 
ejemplo, 


el IS a A n 
det 5 3) = 1)(3) — (2)(5) = —13. 


3. Si A es de nxn para n > 2, entonces el determinante de A 
puede ser expresado como la suma de los productos de cada ele- 
mento de algún renglón o columna de A multiplicado por +1 
veces el determinante de una matriz de (n — 1) x (n — 1) obte- 
nida al eliminar de A el renglón y la columna que contienen el 
elemento en cuestión. La fórmula exacta es 

det(A) = Y (-—1)*4;;* det(4;;) 
j=1 
(si el determinante es evaluado a partir de los elementos del ren- 
glón i de A) o bien 


det(4) = > (-1)*YA;¡¡* det(4;;) 
i=1 
(si el determinante es evaluado a partir de los elementos de la 
columna j de 4), donde 4;; es la matriz de (n — 1) x (n— 1) 
obtenida a suprimir el renglón i y la columna j de A. 


En las expresiones anteriores el escalar (—1)'*det(4;;,) se llama el 
cofactor del elemento A;;. En esta notación el determinante de A se 
evalúa como la suma de productos de cada elemento de algún renglón o 
columna de A multiplicado por el cofactor de ese elemento. Entonces 
det(A) se expresa en términos de n determinantes de matrices de 
(n— 1) x (n— 1). Estos determinantes se evalúan luego en términos 
de determinantes de matrices de (n — 2) x (n — 2) y así sucesivamente, 
hasta que se obtienen matrices de 2 x 2. Los determinantes de las matri- 
ces de 2 x 2 se evalúan entonces como en el inciso 2. 

Consideremos algunos ejemplos de esta técnica al evaluar el determi- 
nante de la matriz de 4 x 4 


1 l 5 


2 

1 s4 u 
T= l 4 L 

2 0 —3 1 

3 6 1 2 


Primero evaluaremos el determinante de A por expansión sobre el cuarto 
renglón. Esto requiere de que conozcamos el cofactor de cada elemento 
del renglón. El cofactor de A,, = 3 es 


Lo 1l 5 
(1D) det 1 —4 —1]. 
0-3 I 


Resumen —conceptos importantes sobre determinantes 225 


Evaluemos el determinante anterior por expansión sobre la primera colum- 
na. Entonces 


les S pende S 7) 1)2+*1(1) det des 
Cer A O ME 


+ (—1)?*1(0) det _, E 


= 1090) — CDE] 
+ (—DOIOO) — 6A=3)] + 0 
= —7 —16 + 0 = —23. 
Así, el cofactor de A. es (—1)*(—23) = 23. Análogamente, el cofactor 


de Aj, = 6 es 
2 ] 5 
(—1)t+? efi —4 — i) 
2 —3 1 


Evaluando este determinante sobre el segundo renglón da 


2 1 5 
ef: =A a) oso, + ora de ) 
2 —3 l 


24+3f__ 2 l 

+(-D 1) de E 

= (OOO — OM + 06060) — 6) 
+ (DEDO 3) — 0) 


= —16 +- 32 — 8 =8. 
Y así el cofactor de A42 es (—1)*(8) = 8. El cofactor de A4, = 1 es 


21 5 
oe 1 —1l. 
20 1 


Si evaluamos este determinante por expansión sobre el tercer renglón, en- 
contramos que 


afi a) coroa oo se, E 
+ EDHO def ) 


= (DIA D — ON] +0 + 10100) — D) 
==1+041 =<==11. 
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Por tanto, el cofactor de A, es (—1)"(—11) = 11. Finalmente, el cofac- 
tor de A,, = 2 es 


21 1 
(nde 1 1 —4]. 
203 


Calculando este determinante por expansión sobre la segunda columna, 
obtenemos 


Ñ E ; 1+1 1 l =q 2+2 1 d 2 l 
det|1 1 -—4|=(-1D)**« ) der, a + (—-D*2(1) et, E 
2 0 —3 
3+2 2 l 
+ (— 1)**(0) det ai 
= (DIME — 90) + 1003 — 00] 
+0 
= —5 — 8 + 0 = -13. 
Por tanto el cofactor de A4, es (—1)*(— 13) = —13. Ahora podemos eva- 


luar el determinante de A multiplicando cada elemento del cuarto renglón 
por su cofactor; esto da 
det(4) = 3(23) + 6(8) + 1(11) + 2(—13) = 102. 
A fin de comparar calcularemos también el determinante de A por 


expansión sobre la segunda columna. El lector deberá verificar que los 
cofactores de A12, A22 y Asz son 14, 40 y 8, respectivamente. Entonces 


bis] 2 15 
det(4) = (—1)*2(D) det[2 —3 — 1|+(-D**Mdetl2 —3 1 
3 1 2 Bs TÍ 

2 5 2 1 5 

+(—1)*+2(0)det| 1 —4 —1|+(-1)**2(6) det 1 —4 —1 

3 1 2 wg j 


= 14 + 40 + 0 + 48 = 102. 

Por supuesto, el hecho de que el valor 102 se haya obtenido de nuevo no 
es ninguna sorpresa puesto que el valor del determinante de A es indepen- 
diente de la elección del renglón o columna utilizada en la expansión. 

Obsérvese que el cálculo de det(4) es más fácil cuando se expande 
sobre la segunda columna que cuando se expande sobre el cuarto renglón. 
La diferencia es la presencia de un cero en la segunda columna, lo que 
hizo innecesario evaluar uno de los cofactores (el cofactor de Az2). Por 
esta razón es benéfico evaluar el determinante de la matriz expandiendo 
sobre el renglón o columna que tenga el mayor número de elementos nulos. 
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De hecho, es a menudo útil introducir ceros en la matriz por medio de 
operaciones elementales en los renglones antes de calcular el determi- 
nante. Esta técnica utiliza las tres primeras propiedades de los determi- 
nantes. 


Propiedades del determinante 


1. Si B es una matriz obtenida al intercambiar dos renglones o colum- 
nas de A, entonces det(B) = —det(A). 

2. Si B es una matriz obtenida al multiplicar todo elemento de algún 
renglón o columna de A por algún escalar c, entonces det(B) = c 
x det(A). 

3. Si B es una matriz obtenida a partir de A al sumar un múltiplo 
del renglón į al renglón j o un- múltiplo de la columna ¡ a la 
columna j, donde i + j, entonces det(B) = det(A). 


Ilustraremos el uso de estas tres propiedades en la evaluación de deter- 
minantes calculando el determinante de la matriz A de 4 x 4 considerada 
anteriormente. Nuestro procedimiento será el de introducir ceros en la 
segunda columna de A utilizando la propiedad 3 y luego expandiendo 
sobre esa columna. (Las operaciones elementales sobre los renglones utili- 
zadas consisten en sumar múltiplos del renglón 1 a los renglones 2 y 4.) 
Este proceso da 


2 1 l 5 2 1 1 5 
1 —4 1 1 0 —5 -6 
det(4) = det roes i = det ORE i 
3 6 l 2 —9 0 —5 —28 
—] —5 —6 
= |(—1)!*? det| 2 —3 l1]. 
—9 —5 —28 


El determinante resultante de una matriz de 3 x 3 puede ser evaluado 
de la misma manera. Utilizaremos operaciones elementales del tipo 3 en 
los renglones para introducir dos ceros en la primera columna y luego 
ẹxpandir sobre ella. Continuando con lo anterior tenemos 


k si =i a5. eý 
det(4) = (=1)del 2 -3  1ļ=(—D-defl 0 -13 —11 
—9 —5 -—28 0 40 26 
—13 —]l 
= (=D (EDEN det 
y (= 1) E N 


-= (—13X(26) — (—11)(40) = 102. 
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El lector debiera comparar este cálculo de det(4) con los anteriores para 
determinar cuánto trabajo de menos se requirió cuando se emplearon las 
propiedades 1, 2 y 3. 

En los siguientes capítulos tendremos a menudo que evaluar el deter- 
minante de matrices de formas especiales. Las siguientes tres propiedades 
de determinantes serán de gran utilidad para ello. 


4. det(I) = 1. 

5. Si dos renglones (o columnas) de una matriz son idénticos, el 
determinante de la matriz es cero. 

6. El determinante de una matriz triangular es igual al producto de 
los elementos de la diagonal. 


Como ilustración de la propiedad 6, véase que 


—3 0 0 
del 1 4 0 |=(-3I40-09) = 72. 
2 5 —6 


Las cuatro propiedades restantes del determinante se utilizarán fre- 
cuentemente en capítulos posteriores. De hecho probablemente la propie- 
dad más significativa del determinante es que proporciona una caracteriza- 
ción sencilla de las matrices invertibles (véase propiedad 10). 


7. Para cualquier A, det(4) = det(A*). 

8. Para cualquier A, B € Maxn(F), det(AB) = det(A) : det(B). 
9. Si O es una matriz invertible, entonces det(Q-*) = [det(0)]”. 
10. Una matriz Q es invertible si y sólo si det(Q) 40. 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) El determinante de una matriz cuadrada puede ser calculado expan- 


diendo la matriz sobre cualquier renglón o columna. 


(b) Al evaluar el determinante de una matriz, es conveniente expandir 


sobre un renglón o columna que contenga el mayor número de ceros. 


(c) Si dos renglones o columnas de A son idénticos, entonces det(A4) = 0. 
(d) Si B es una matriz obtenida al intercambiar dos renglones o colum- 


nas de A, entonces det(B) = det(A4). 


(e) Si B es la matriz obtenida al multiplicar todos los elementos de un 


renglón o columna de A por un escalar; det(B) = det(4). 


(f) Si B es una matriz obtenida a partir de A sumando un múltiplo de 


algún renglón a un renglón distinto (o un múltiplo de alguna columna 
a alguna columna distinta), entonces det(B) = det(4). 


(g) El determinante de una matriz triangular de n x n es igual al pro- 


ducto de sus elementos de la diagonal, 


2. 


3. 
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(h) det(4*) = —det(A). 

(i) Si A, BEM,axn(F), entonces det(AB) = det(A) : det(B). 

(j) Si Q es una matriz invertible, entonces det(Q”*) = [det(O)]”. 
(k) Una matriz Q es invertible si y sólo si det(Q) 40. 


Evaluar el determinante de las siguientes matrices de 2 x 2. 
(a) [4 -—5 (b) /—1 7 

2 3 3 8 
(c) /2+i —i+3i (d) 3 4i 

1— 2i 3—i —6i 2i 


Evaluar el determinante de las siguientes matrices en la manera indicada. 
(a) Expandir sobre la segunda columna 


0 1 2 
—1 0 —3 
23 0 
(b) Expandir sobre el tercer renglón 
1 0 2 
O I 5 
—1 3 0 
(c) Expandir sobre la primera columna 


0 l+i 2 
—2i 0 E 
3 4i 0 


(d) Expandir sobre el primer renglón 


i 2+i 0 
-i 3 2i 
0 —1 1—i 


(e) Expandir sobre la cuarta columna 


0 2 1 3 
l o —2 2 
3 —l o 1 
—1 1 2 0 


Evaluar el determinante de las siguientes matrices por cualquier método per- 
mitido. 


@ /2 50% D -1 32M (o) 1 03 
-s 23) EES a 
0 —4 2 2 25 =3 21 
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(d) i 2 —1 (e) /—l 2+i 3 
3 1+i 2 l—i i 1 
=2i 1 4—-i 3i 2 —l+i 

(£f) 1 0 —2 3 (g) /4 2+i 2i S+2i 
—3 1 I 2 0 i—i 1 3—4i 
0 4 —1 1 0 0 3i 6 
2 3 O 1 0 0 0 2 


5.* Trabajar sobre el Ejercicio 9 de la Sección 4.3. 
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Capítulo 5 


Diagonalización 


5.1 


Este capítulo trata el llamado “problema de la diagonalización”. Dada 
una transformación lineal T: V— V, donde V es un espacio vectorial 


dimensionalmente finito, buscaremos respuestas a las siguientes interro- 
gantes: 


1. ¿Existe una base ordenada 8 para V tal que [T]¿ sea una matriz 
diagonal? 
2. Si dicha base existe, ¿cómo puede encontrarse? 


Como en general los cálculos que involucran a las matrices diagonales son 
sencillos, una respuesta afirmativa a la pregunta 1 nos conducirá a un 
mayor entendimiento de cómo la transformación T opera sobre V, y una 
respuesta a la pregunta 2 nos permitirá obtener soluciones fáciles a mu- 
chos problemas de orden práctico que pueden formularse dentro del 
contexto del álgebra lineal. Consideraremos algunos de estos problemas 
y sus soluciones dentro de este mismo capítulo —véase por ejemplo la 
Sección 5.3. 

Una solución al problema de la diagonalización conduce de una mane- 
ra natural a los conceptos de “eigenvalor” (valor propio o característico) 
y “eigenvector” (vector propio o característico). Aparte del importante 
papel que estos conceptos juegan en el problema de la diagonalización, 
su utilidad quedará también demostrada como valiosas herramientas en el 
estudio de muchas transformaciones no diagonalizables, tal como lo vere- 
mos en el Capítulo 6. 


EIGENVALORES Y ElGENVECTORES 


Como el problema de la diagonalización implica el estudio de una. trans- 
formación que mapee a un espacio vectorial en sí mismo, es útil dar un 
nombre a tal transformación. En consecuencia, llamaremos a la transfor- 


mación lineal T: VW-—V sobre un espacio vectorial V, un operador lineal 
sobre V. 
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Para un operador lineal dado T sobre un espacio vectorial dimensional- 
mente finito V, nos interesarán las matrices que representen a T de acuerdo 
con las diferentes bases ordenadas para V. 

A lo largo de este capítulo omitiremos en general la palabra “orde- 
nada” en la expresión “base ordenada”. 

Considérese un operador lineal T en un espacio vectorial dimensional- 
mente finito V y cualquier par de bases 8 y f” para V. Recuérdese del 
corolario al Teorema 2.27 que las matrices [T]g y [T]g- están relacionadas 
mediante la expresión 


[T] = Q-[TIGO, 


donde Q es la matriz de cambio de coordenadas que transforma las 
coordenadas de 8’ en coordenadas de 8. En la Sección 2.5 definimos 
tales matrices como matrices similares. Un caso especial de utilidad de 
este tipo de relaciones se demuestra en el siguiente teorema. 


Teorema 5.1. Sea AEMpin(F) y sea y = [X,, Xz, ..- , Xn} una base cualquie- 


ra para F”. Entonces [Laly = QAQ, donde Q es una matriz de n x n en 
la que la columna j es x; (j = 1, 2,..., n). 


DEMOSTRACIÓN. Sea f la base estándar para F". Se puede ver fácilmente 
que la matriz Q es la matriz de cambio de coordenadas que transforma 
las coordenadas de y en coordenadas de 8. Por lo tanto 


[Laly = Q”ILaJgQ = QAQ. ME 
Ejemplo 1. Para ilustrar el Teorema 5.1, sean 


KECO 


Es muy sencillo verificar que si 
entonces 


y por tanto 


w=oue= (3 DEA e 5 


Como se mencionó anteriormente, las matrices que representan al mis- 
mo operador lineal relativo a bases diferentes son similares. Establecere- 
mos en seguida el recíproco de este resultado. 
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Teorema 5.2. Sea T un operador lineal en un espacio vectorial V n-dimensio- 
nal, y sea B una base para V. Si B es cualquier matriz de n x n similar 
a [T]g, entonces existe una base B’ para V tal que B = [Tlg-. 


DEMOSTRACIÓN. Si B es similar a [T]g, entonces existe una matriz inver- 
tible Q tal que B = Q”I[TI¿Q. Supóngase que 8 = [X1, X2, - +» » Xn} y de- 
fínase 


x, = Y Qix para 1 <j <n. 


Entonces 8’ = {x', x!,..., x,) es una base para V tal que Q es la matriz 
de cambio de coordenadas que transforma las coordenadas de 8’ en coor- 
denadas de 8. (Ejercicio 11 de la Sección 2.5.) Por lo tanto 


[Ts. = QT] = B 
de acuerdo con el corolario del Teorema 2.27. MW 


El concepto de similitud es de utilidad en el estudio del problema de 
la diagonalización, pues puede ser utilizado para reformular el problema 
dentro del contexto matricial. Introduciremos ahora el concepto de dia- 
gonalizabilidad. 


Definiciones. Se dice que un operador lineal T sobre un espacio vectorial dimen- 
sionalmente finito V es diagonalizable si existe una base B para V tal que 
[T]g sea una matriz diagonal. 
Una matriz cuadrada A es diagonalizable si A es similar a una matriz 
diagonal. 


El teorema siguiente relaciona estos dos conceptos y conduce a una 
reformulación del problema de la diagonalización dentro del contexto 
matricial. 


Teorema 5.3. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Los siguientes incisos son equivalentes: 


(a) T es diagonalizable. 
(b) Existe una base ß para V tal que la matriz [T]a es diagonalizable. 
(c) La matriz [T], es diagonalizable para cualquier base y para V. 


DEMOSTRACIÓN. Si T es diagonalizable, entonces existe una base 8 para 
V tal que [T]g es una matriz diagonal. Entonces [T]g es trivialmente diago- 
nalizable, por lo que (a) implica a (b). 


Sea 8 una base para V tal que [T]g es diagonalizable y sea y una base 
cualquiera para V. Entonces [T]g y [T], son similares. Luego, si [T]ẹ es 
similar a una matriz diagonal, también [T], lo será de acuerdo con la 
transitividad de la relación de similitud. Y entonces [T]y es diagonali- 
zable, demostrando que (b) implica a (c). 
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Finalmente, si [T], es diagonalizable, existe una matriz diagonal D 
similar a [T],. Luego, de acuerdo con el Teorema 5.2, existe una base p' 
para V tal que [T]g- = D. Por tanto, T es diagonalizable y así (c) implica 
a (a). E 


Como una consecuencia inmediata de este Teorema tenemos el siguien- 
te resultado de gran utilidad. 


Corolario. Una matriz A es diagonalizable si y sólo si L, es diagonalizable. 


Como consecuencia del Teorema 5.3 podemos reformular el problema 
de la diagonalización de la manera siguiente. 


1. ¿Es diagonalizable una matriz cuadrada A dada? 
2. Si A es diagonalizable, ¿cómo puede determinarse una matriz Q 
invertible tal que QAQ sea una matriz diagonal? 


Presentaremos ahora el primero de los diferentes resultados que con- 
ducen a una solución del problema de la diagonalización. 


Teorema 5.4. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Entonces T es diagonalizable si y sólo si existe una base 


B = {Xn ..., Xn} para V y escalares àis - +. , Àn (no necesariamente dis- 
tintos) tales que T(x;) = \;Xx;, para 1 <j<n. Bajo estas circunstancias 
4 0 +». 0 
0 Aà 0 
[T]; E ` 
0 0 --- 4 


DEMOSTRACIÓN. Supóngase que T es diagonalizable. Entonces existe una 
base 8 para V tal que [T]g = D es una matriz diagonal. Sean à; = D;; y 
B= (X,, ... , xn). Entonces para cada j, 


n 
Tx) = X Dixi = Djjx; = AjX;. 


i=1 


Recíprocamente, 'supóngase que existe una base B= PA E 
escalares ài, ... , An tales que T(x;) = Ajx;. Entonces evidentemente 
A 0-0 
A POE 
[T]; = ` 
0O 0o A l 


Del Teorema 5.4 se derivan las siguientes definiciones. 
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Definiciones. Sea T un operador lineal en un espacio vectorial V. Un elemento 
no nulo x€ V se llama eigenvector de T si existe un escalar A tal que 
T(x) = Ax. Al escalar à se le llama eigenvalor correspondiente al eigen- 
vector X. 

Análogamente, si A es una matriz de n x n en un campo F, un ele- 
mento no nulo x €F" se denomina eigenvector de la matriz A, si x es un 
eigenvector de La. Como en el párrafo anterior, el escalar à se denomina ei- 
genvalor de A correspondiente al eigenvector x. 


A menudo se usan las palabras vector característico y vector propio 
en lugar de eigenvector. Los términos correspondientes para un eigenvalor 
son valor característico y valor propio. 

Con esta terminología vemos que en el Teorema 5.4 la base 8 consta 
de eigenvectores de T y que los elementos de la diagonal de [T]g son los 
eigenvalores de T, por lo que el Teorema 5.4 puede ser enunciado de 
nuevo de la manera siguiente: Un operador lineal T en un espacio vectorial 
dimensionalmente finito V es diagonalizable si y sólo si existe una base f 
para V compuesta por eigenvectores de T. Además, si T es diagonalizable, 


B= (Xi, Xp... , Xa} es una base de eigenvectores de T, y D = [Tlg; en- 
tonces D es una matriz diagonal y Di; es el eigenvalor correspondiente a 
x: (G= 1,2,..., n). 


Antes de continuar con nuestro análisis del problema de la diagonali- 
zación consideremos dos ejemplos que involucran eigenvectores y eigen- 
valores. 


Ejemplo 2. Sea C*(R) el conjunto de todas las funciones f: R R 
que tienen derivadas de todos los órdenes. (Por lo tanto C” (R) incluye a 
todas las funciones polinomiales, las funciones seno y coseno, las funciones 
exponenciales, etc.) Es fácil ver que C*(R) es un subespacio del espacio 
vectorial F(R, R) de todas las funciones de R en R como se definieron en 
la Sección 1.2. Defínase T: C*(R)—>C*(R) mediante T(y) = y”, donde 
y' es la derivada de y. Puede verificarse fácilmente que T es un operador 
lineal en C*(R). Procederemos a determinar los eigenvalores y los eigen- 
vectores de T. 

Si A es un eigenvalor de T, entonces existe un eigenvector y EC*(R) 
tal que y” = T(y) = Ay. Esta es una ecuación diferencial de primer orden 
cuyas soluciones son de la forma y(t) = ce para alguna constante c. 
En consecuencia, todo número real A es un eigenvalor de T y los eigen- 
vectores correspondientes son de la forma ce para c4 0. (Nótese que 
si A = 0, los eigenvectores son las funciones constantes no nulas.) 


Ejemplo 3. Sea 
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A) 


x, es un eigenvector de L, (y por tanto de 4). También A, = —2 es el 
eigenvalor asociado con x,. Además, 


Lat) = (4 Aa = (20) =G) = 


Luego, x, es un eigenvector de L4 (y de 4) con à: = 5 como eigenvalor 
asociado. Nótese que B = (x,, X2} es una base para R’, y por tanto, por 
el Teorema 5.4 


Como 


Finalmente, si 


entonces por el Teorema 5 .1 j 
2 0 
QAQ [Lals ( 0 > . 


El ejemplo anterior muestra una técnica para diagonalizar una matriz 


A de n x n: Si B = [X,, Xz, ... , Xn} es una base para F" que consta de 
los eigenvectores de A, y Q es la matriz de n x n cuya columna j es el 
eigenvector x,(j = 1, 2, ... , n), entonces Q 40 es una matriz diagonal. 


Para poder emplear este procedimiento necesitamos de un método para 
determinar los eigenvectores de una matriz u operador. Como se verá 
luego, los eigenvectores se determinan fácilmente una vez que se conocen 
los eigenvalores, por lo que principiaremos exponiendo un método para 
calcular los eigenvalores. Como ayuda en este cálculo utilizaremos el teore- 
ma siguiente para introducir el concepto de “determinante” de un operador 
lineal. 


Teorema 5.5. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V y sean B y B' un par de bases cualesquiera para V. Entonces 


det([T]g) = det([TIg-). 


DEMOSTRACIÓN. Sean A = [Tlg y B = [Tlg-. Como A y B son similares, 
existe una matriz invertible O tal que B = Q40. Por lo tanto 
det(B) = det(O”A4A0) = det(O”*) : det(A) : det(O) 
= [det(Q)]* : [det(4)]: [det(Q)] = det(4). Mi 


Este resultado da lugar a la siguiente definición. 
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Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V. Definimos el determinante de T, que denotaremos por det(T), de 
la manera siguiente: Escójase una base B para V, y defínase det(T) = det 
([T]a). Nótese que según el Teorema 5.5 det(T) está bien definido, es 
decir, es independiente de la selección de la base f. 


Ejemplo 4. Sea T: P,(R) > P2(R), definida mediante T(f) = f', la de- 
rivada de f. Para calcular det(T), sea 8 = (1, x, x°}. Entonces 8 es una 
base para P.(R) y 
01 0 
mM, =|0 O 2]- 
000 
Por lo tanto det(T) = det([T]g) = 0. 


Nuestro siguiente resultado establece algunas propiedades del deter- 
minante de un operador lineal. Nótese la semejanza de estas propiedades 
con las que demostramos para el determinante de una matriz en el Capí- 
tulo 4. 


Teorema 5.6. Sea T un operador lineal en un espacio vectorial dimensionalmen- 
te infinito V. Entonces 


(a) T es invertible si y sólo si det(T) Æ 0. 

(b) Si T es invertible, entonces det(T*) = [det(T)I”. 

(c) SiU: V—V es lineal, entonces det(TU) = det(T) : det(U). 

(d) Si à es un escalar y B es una base cualquiera para V, entonces 


det(T — Aly) = det(A — AD, 
donde A = [Tlg. 


DEMOSTRACIÓN. Las demostraciones de los incisos (a), (b) y (c) se de- 
jan como ejercicios. Para demostrar el inciso (d), supóngase que A es un 
escalar, 8 es una base para V y A = [T]g. Entonces [lv]g = 1, y por lo tan- 
to [T — Aly] = A — Al. Luego, por definición det(T — Aly) = det(A — 
A). B 


El teorema siguiente nos proporciona un método para calcular los 
eigenvalores. 


Teorema 5.7. Sea T un operador lineal en un espacio vectorial dimensionalmen- 
te finito V sobre un campo F. Un escalar ACF es un eigenvalor de T 
si y sólo si det(T — M) = 0. 


DEMOSTRACIÓN. Supóngase que A es un eigenvalor de T. Entonces existe 
un eigenvector x €V(x 40) tal que T(x) = Ax. Luego O=T(x) — Ax = 
(T — AM) (x). Como x +0, T — Al no es invertible. Así, según el Teorema 
5.6, det(T — Al) = 0. 
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Recíprocamente, supóngamos que det(T — Al) = 0. Entonces, de nue- 
vo por el Teorema 5.6, T — Al no es invertible. Luego existe un vector no 
nulo xEV tal que xEN(T — al). Entonces (T — Al) (x) =0, y lógica- 
mente T(x) = Ax. Por lo tanto x es un eigenvector (con A como eigenvalor 
asociado) de T. MW 


Corolario 1. Sea A una matriz de n x n sobre un campo F. Entonces un esca- 
lar AE F es un eigenvalor de A si y sólo si det(A — AI) = 0. 
DEMOSTRACIÓN, Ejercicio. 


Ejemplo 5. Sea 


2/1 1 
A= (a 1) E Mo. (R). 
Como 


det(A = a1) = det (12 pa) MAI DA+D, 


los únicos eigenvalores de A son 3 y —1. 


Ejemplo 6. Sea T: P,(R)=>P,(R) el operador lineal definido mediante 
T(f(x)) = f(x) + xf'(x) + f'(x), y sea B= {1, x, x?}. Entonces 8 es 
una base para P.(R) y 


11.0 
[TJ =|0 2 2]. 
0 0 3 
Como 


det(T — 41) = det([T], — 41) = det] 0 2-4 2 
0 0 374 
= (1 — AQ — MG — 4) 
= —(1 — A — 24 — 3), 


A es un eigenvalor de T si y sólo si A= 1,2 o 3. 


El Ejemplo 6 hace uso de la siguiente consecuencia evidente del Teo- 
rema 5.6. 


Corolario 2. Sea T un operador lineal en un espacio vectorial dimensionalmen- 
te finito V, y sea B una base para V. Entonces à es un eigenvalor de T 
si y sólo si es un eigenvalor de [Tlg. 


En los Ejemplos 5 y 6 el lector habrá podido observar que si A es 
una matriz de n x n, entonces det(A — A1,) es un polinomio en A de gra- 
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do n con un coeficiente principal (—1)”. Los eigenvalores de A son 
sencillamente ceros de este polinomio; de manera que la siguiente defi- 
nición es apropiada. 


Definición. Si AE€EM,,..(E), el polinomio det(A — tl,) en la incógnita t se 
denomina polinomio característico de A.* 


Se puede demostrar fácilmente que matrices semejantes tienen el mis- 
mo polinomio característico (ver Ejercicio 12). Este hecho permite la 
definición siguiente. 


Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con base B. Definimos al polinomio característico f(t) de T como 
el polinomio característico de A = [T]g; esto es, 


f(t) = det(A — tI). 


La observación que precede a la definición muestra que ésta es inde- 
pendiente de la selección de la base 8. A menudo representaremos al 
polinomio característico de un operador T mediante det(T — rl). 

El siguiente resultado confirma nuestras observaciones sobre los Ejem- 
plos 5 y 6; puede demostrarse mediante un argumento directo de in- 
ducción. 


Teorema 5.8. El polinomio característico de A €Mnxn(F) es un polinomio de 
grado n con coeficiente principal (—1)". 


Las siguientes consecuencias del Teorema 5.8 son inmediatas. (Véase 
también el Corolario 2 del Teorema E.2.) 


Corolario 1. Sea A cualquier matriz de n x n y sea f(t) el polinomio caracte- 
rístico de A. Entonces 


(a) Un escalar à es un eigenvalor de A si y sólo si A es un cero del 
polinomio f(t) (es decir, si y sólo si f(A) = 0). 
(b) A tiene como máximo n eigenvalores distintos. 


Corolario 2. Sea T un operador lineal en un espacio vectorial n-dimensional V 
con polinomio característico f(t). Entonces 


(a) Un escalar à es un eigenvalor de T si y sólo si A es un cero del 
polinomio f(t) (es decir, si y sólo si (A) = 0). 
(b) T tiene como máximo n eigenvalores distintos. 


se 
ES 


El lector observador debe haber notado que los elementos de la matriz 
A — tl, no son elementos del campo F. Sin embargo, son elementos de otro campo 
F(t). (El campo F(t) es el campo de los cocientes del anillo de los polinomios 
F[t]. Normalmente esto se estudia en cursos de álgebra abstracta.) En consecuencia 
los resultados sobre determinantes demostrados en el capítulo 4 continúan siendo 
ciertos dentro de este contexto. 
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Los dos corolarios anteriores nos proporcionan un método para deter- 
minar todos los eigenvalores de una matriz o de un operador, y nuestro 
siguiente resultado nos proporciona un procedimiento para determinar los 
eigenvectores correspondientes a un eigenvalor dado. 


Teorema 5.9. Sea T un operador lineal en un espacio vectorial V, y sea A un 
eigenvalor de T. Un vector x€V es un eigenvector de T que corresponde 
a à si y sólo si xÆ0 y xEN(T — al) 


DEMOSTRACIÓN. Ejercicio. 


Ejemplo 7. Para encontrar todos los eigenvectores de la matriz 


=( 


del Ejemplo 5, recuérdese que A tiene dos eigenvalores, A, = 3 y à: = —1. 
Principiaremos encontrando todos los eigenvectores correspondientes a 
A, = 3. Sea 


A de A ANA ON 2 1 
A mi = (4 1) ( a= 4 -2): 
Entonces 
= Xi 2 


es un eigenvector correspondiente a à, = 3 si y sólo si x0 y si 
x EN(Ls), esto es, x 40 y 


=2 1 X1 = —2x + X2 ps 0 
4 —2 Xz 4x, E 2x 0 i 
Evidentemente el conjunto de todas las soluciones de la ecuación ante- 
rior es 
1 
fi) rer}. 
Por lo tanto x es un eigenvector que corresponde a A, = 3 si y sólo si 


x= (3) para alguna 140. 


Ahora, supóngase que x es un eigenvector de A que corresponde a 
Ao A 1. Sea 


N OA N -i ÀL R2 N, 
B=4-x1=(; 1) ( 0 aG 2); 


— [^ 
x= (7) ento) 


entonces 
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si y sólo si x es una solución al sistema 


2x, + X= 
4x, + 2x, = 0. 


100 (4) re} 


Luego, x es un eigenvector que corresponde a Az = —1 si y sólo si 


Por lo tanto 


x= ¡a para alguna 140. 


(G) (-2)} 


es una base para R? que está formada de eigenvectores de A. Luego, por 
el Teorema 5.4, L, (y por lo tanto A) es diagonalizable. De hecho, si 


2= (2 -2) 


el Teorema 5.1 implica que 


3 0 
QAQ = (o -1) 
En el Ejemplo 6 vimos que el operador lineal T en P.(R) definido 


mediante T(f(x)) = f(x) + xf'(x) + f'(x) tiene como eigenvalores a 1, 
2 y 3. Ahora calcularemos los eigenvectores de T. 


Obsérvese que 


P (R) E TPR) 


$g $e 


L 
pnm R? 


figura 5.1 


Recordemos el diagrama de la Fig. 5.1 que procede de la Sección 2.4, 
donde 8 = {1, x, x°} y 


Demostraremos que v €P,(R) es un eigenvector de T correspondiente 
a A si y sólo si ġg(v), es un eigenvector de A correspondiente a A. (Este 
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argumento es válido para cualquier operador en un espacio vectorial di- 
mensionalmente finito.) Si v es un eigenvector de T que corresponde a 
A, entonces T(v) = Av. Por lo tanto 


Lipa(v) = ógTlv) = $alav) = Apalv). 


Ahora bien, ¿g(v) 40 puesto que pg es un isomorfismo. Luego ¿g(v) 
es un eigenvector de L, (y por lo tanto de 4) que corresponde a A. Como 
el argumento anterior es reversible, podemos establecer de manera similar 
que si ¿g(v) es un eigenvector de A que corresponde a A, entonces v 
es un eigenvector de T que corresponde a a. 

Una formulación equivalente del resultado demostrado en el párrafo 
anterior es que para cualquier eigenvalor A de A (y por lo tanto de T), 
un vector y € R* es un eigenvector de A que corresponde a A si y sólo si 
p (y) es un eigenvector de T correspondiente a A. Este hecho nos permite 


calcular los eigenvectores de T tal como lo hicimos en el Ejemplo 7. 
Sea A, = l y defínase 


Puede demostrarse fácilmente que 
l 

N(L) =<al O |: ac R$. 
0 


Luego los eigenvectores de A que corresponden a A, son de la forma 
l 
aj 0 
0 


para alguna a 4 0. En consecuencia, los eigenvectores de T que correspon- 
den a A, = 1 son de la forma 


l 


Pal 0 |] = aps (e) =a 
0 


para alguna a 40. Por lo tanto, los polinomios constantes no nulos son 


los eigenvectores de T que corresponden a A.. 
Ahora sea A. = 2 y defínase 


=E 1 0 
B=A-—dAiI=| 0 0 2} 
0 0 1 
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De nuevo puede verificarse fácilmente que 


1 
N(Ls) =4a] 1 |: as Ry 
0 
Entonces, los eigenvectores de T que corresponden a A. son de la forma 
E 
bs al 1 || =a05'(e, + e1) = a(l + x) =a + ax 
0 


para alguna a 40. 
Finalmente, considérese Az = 3 y 


—2 1 0 
B=A-—dAjl=| 0 —1 2]- 
0 0 0 


Como 
1 


N(Ls) =jal 2 |: ae Ry 
l 


cualquier eigenvector de T correspondiente a A¿ = 3 es de la forma 
1 
z| al 2 || = ap; '(e, + 2e, + e3) = all + 2x + x?) = a + 2ax + ax? 
1 
para alguna a 4 0. 
Nótese también que y = (1, 1 +x, 1 + 2x + x°} es una base para 
P.(R) que consta de eigenvectores de T. Luego, T es diagonalizable y 
1.0.0 
[mT], =|0 2 0)- 
0 0 3 
Terminaremos esta sección analizando los eigenvectores y los eigen- 
valores desde un punto de vista geométrico. Si x es un eigenvector del 
operador lineal T en V, entonces T(x) = Ax para algún escalar A. Sea W = 


L(lx]1) el subespacio unidimensional de V generado por x. Si y€ W, 
entonces y = cx para algún escalar c. Entonces 


TO) = Tex) = cT(x) = cAx = Ay EW. 


De manera que T mapea a W en sí mismo. Si V es un espacio vectorial 
sobre el campo de los números reales, entonces W puede considerarse como 
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una recta que pasa por el origen de V (o sea, a través del cero). El ope- 
rador T opera en los elementos de W multiplicando a cada elemento por 
el escalar A. Existen diversas posibilidades para la acción de T depen- 
diendo del valor de A (véase Fig. 5.2). 


Caso 1. Sia > 1, entonces T mueve a los elementos de W a puntos más 
lejanos al cero por un factor A. 


Caso 2. Si à= 1, entonces T opera como la transformación identidad 
en W. 


Caso 3. Si 0<A< 1 T mueve a los elementos de W a puntos más 
cercanos a O por un factor A. 


Caso 4. Si A = 0 entonces T opera como la transformación cero en W. 


Caso 5. Si à< 0 entonces T invierte la orientación de W; esto es, T 
desplaza los puntos de W de un lado del cero al otro. 


y 
E 
peu Caso 2. A= 1 
0 


y Caso 3. 0<A<1 
Ty) 


y 
y Caso 5.1 < 0 
A 


La acción de T sobre W = L((x)) cuando x es un eigenvector de T. 


Caso 4.1=0 


figura 5.2 


Para ilustrar estas ideas, considérense los operadores lineales introdu- 
cidos en los Ejemplos 6, 7 y 5 de la Sección 2.1. Recuérdese que el 
operador T: R?— R? definido mediante T(x,, x) = (xı, —x,) es una 
reflexión sobre el eje x. Se ve fácilmente que T mapea a ambos ejes en sí 
mismos; luego e, y e. son eigenvectores de T (correspondientes respectiva- 
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mente a los eigenvalores 1 y — 1). Obsérvese que T opera como la identidad 
sobre el eje x e invierte la orientación del eje y. Luego considérese la 
proyección sobre el eje de las x definida mediante U(x,, x.) = (xı, 0). De 
nuevo es geométricamente evidente que U actúa como la identidad en el 
eje x y como la transformación cero en el eje y. Este comportamiento es 
una consecuencia del hecho de que e, y e. son eigenvectores de U corres- 
pondientes respectivamente a los eigenvalores 1 y O. Finalmente, recuérdese 
que la rotación a través del ángulo 0 es el operador To: R?— R? definido 
mediante To(x,, x) = (xı cos 0 — x, sen 0, x, sen + x,cos 0). Si 0< 
0 <x es geométricamente claro que Te no mapea a un espacio unidi- 
mensional de R? en sí mismo. Esta observación implica que Tə no tiene 
eigenvectores (y por tanto tampoco eigenvalores). Para confirmar esta 
conclusión utilizando el Corolario 2 del Teorema 5.8, vemos que el poli- 
nomio característico de Te es 


cos Ó — t — sen 0 


det(T. — 11) = det ( Send oi] 


)= t — (2 cos0)t +1, 

el cual no tiene ceros reales puesto que el discriminante 4 cos* 0 — 4 es 
negativo para 0 < 0 < m. Luego, existen operadores (y por tanto matri- 
ces) sin eigenvalores ni eigenvectores. Por supuesto, tales operadores y 
matrices no son diagonalizables. 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Todo operador lineal en un espacio vectorial n-dimensional tiene n 
eigenvalores distintos. 

(b) Si una matriz real tiene un eigenvector, entonces tiene un número 
infinito de eigenvectores. 

(c) Existe una matriz cuadrada sin eigenvectores. 

(d) Los eigenvalores deben ser escalares no nulos. 

(e) Cualquier par de eigenvectores son linealmente independientes. 

(f) La suma de dos eigenvalores de un operador lineal T es también un 
eigenvalor de T. 

(g) Los operadores lineales de espacios vectoriales dimensionalmente in- 
finitos nunca tienen eigenvalores. 

(h) Una matriz A de n x n con elementos de un campo F es similar a 
una matriz diagonal si y sólo si existe una base para F" compuesta 
de eigenvectores de A. 

(i) Matrices similares siempre tienen los mismos eigenvalores. 

(j) Matrices similares siempre tienen los mismos eigenvectores. 

(k) La suma de dos eigenvectores de un operador T es siempre un eigen- 
vector de T. 
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Para cada matriz A y base-8, encontrar [L,]g. Encontrar también una matriz 
invertible Q tal que [La] = QAQ. 


A A) 


1 1-1 1\ /1\ /1 
© 4=|2 0 1] y B=[1b[ ob 1 
11 0 11/12 


Para cada una de las siguientes matrices A € Mnaxn (F). 


(1) Determínense todos los eigenvalores de A. 

(ii) Para cada eigenvalor A de A, encontrar el conjunto de eigenvectores 
correspondientes a A. 

(iii) De ser posible, encuéntrese una base para F” compuesta por eigenvec- 
tores de A. 

(iv) Si se tiene éxito en encontrar la base en (iii), determínese una matriz 
Q tal que QAQ sea una matriz diagonal y calcúlese Q4Q. 


(1 2 È 
(a) a=(3 2) para F=R 
0 -2 -3 
(b) A= | -I1 1 —1 | para F=R 


(c) = 2) para F= C 


Sea T: P.(R) >P,(R) definida mediante T((fx)) = f(x) + xf'(x). En- 
contrar todos los eigenvalores de T y encontrar una base 8 para P.(R) tal 
que [T]g sea una matriz diagonal. 


Demostrar los incisos (a), (b) y (c) del Teorema 5.6. 
Demostrar los Corolarios 1 y 2 del Teorema 5.7. 
Demostrar el Teorema 5.9. 


(a) Demostrar que un operador lineal T en un espacio vectorial dimen- 
sionalmente finito es invertible si y sólo si el cero no es un eigen- 
valor de T. 

(b) Sea T un operador lineal invertible. Demostrar que un escalar A es 
un eigenvalor de T si y sólo si A”* es un eigenvalor de T~. 


Demostrar que los eigenvalores de una matriz triangular M son los elemen- 
tos de la diagonal de M. 


Sea V un espacio vectorial dimensionalmente finito y A un escalar cual- 
quiera. 


11. 


12. 


13. 


14.* 


15.* 


16. 


(a) 
(b) 
(c) 
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Para cualquier base 8 para V demostrar que [Aly]; = 41. 

Calcular el polinomio característico de Aly. 

Demostrar que Aly es diagonalizable y que tiene sólo un eigen- 
valor. 


Una matriz escalar es una matriz cuadrada de la forma A para algún esca- 
lar A; o sea, una matriz escalar es una matriz diagonal en la cual todos los 
elementos de la diagonal son iguales. 


(a) 
(b) 
(c) 


(a) 
(b) 


Demostrar que si A es similar a una matriz escalar AZ, entonces 
Á= MN. 

Demostrar que una matriz diagonalizable que sólo tiene un eigen- 
valor es una matriz escalar. 

Concluir que la matriz 


no es diagonalizable. 


Demostrar qué matrices similares tienen el mismo polinomio carac- 
terístico. 

Demostrar que la definición del polinomio característico de un ope- 
rador lineal en un espacio vectorial dimensionalmente finito V es 
independiente de la selección de la base para V. 


Demostrar las siguientes aseveraciones hechas en la página 241. 


(a) 


(b) 


Si vEP2(R) y ¿g(v) es un eigenvector de A correspondiente al eigen- 
valor A entonces v es un eigenvector de T que corresponde al eigenva- 
lor a. 

Si A es un eigenvalor de A (y por tanto de T), entonces un vector 
y ER? es un eigenvector de A correspondiente a A si y sólo si $0) 
es un eigenvector de T correspondiente a A. 


Para cualquier matriz cuadrada A, demostrar que A y At tienen el mismo 
polinomio característico (y por tanto los mismos eigenvalores). 


(a) 


(b) 


(a) 


Sea T un operador lineal en un espacio vectorial V, y sea x un eigen- 
vector de T correspondiente al eigenvalor A. Para cualquier entero 
positivo m, demostrar que x es un eigenvector de T” correspondiente 
al eigenvalor A”. 

Enunciar y demostrar el resultado para matrices, semejante al del 
inciso (a). 


Demostrar qué matrices similares tienen la misma traza. Sugerencia: 
Utilizar el Ejercicio 12 de la Sección 2.3. 
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18. 


19.* 


20. 


21. 


22.* 
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(b) ¿Cómo se definiría la traza de un operador lineal en un espacio 
vectorial dimensionalmente finito? Justificar que la definición que 
se dé es correcta. 


Sea T: Muin(F) > Mun (F) el mapeo definido mediante T(4) = At, la 
transpuesta de A. 


(a) Verificar que T es un operador lineal en M,,,(F). 

(b) Demostrar que +1 son los únicos eigenvalores de T. 

(c) Describir las matrices que sean eigenvectores correspondientes a los 
eigenvalores 1 y —1, respectivamente. 


Demostrar que para cualesquiera A, BEM,:»(C) tal que B es invertible, 
existe un escalar c € C tal que A + cB no es invertible. Sugerencia: Exa- 
minar a det(A + cB). 


Sean A y B matrices similares de n x n. Demostrar que existe un espacio 
vectorial n-dimensional V, un operador lineal T en V y bases 8 y y para 
V tales que A = [Tlg y B = [T],. Sugerencia: Utilizar el Ejercicio 12 de 
la Sección 2.5. 


Sea A una matriz de n x n con polinomio característico 
A E le Eaa a a a 


Demostrar que f(0) = a, = det(A). Deducir que A es invertible si y sólo 
si a, 40. 


Sean A y f(t) como en el Ejercicio 20. 


(a) Demostrar que f(t) = (A,, — 1) (Av: — 1)...(Ann — t) + q(t), don- 
de q(t) es un polinomio en £ de grado a lo más (n — 2). 
(b) Demostrar que tr(4) = (—1)"-"ap-,. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
sobre el campo F. Demostrar que si g(t) EP(F) y x es un eigenvector de 
T correspondiente al eigenvalor A entonces g(T)(x) = g(A)x. 


DIAGONALIZABILIDAD 


En la Sección 5.1 hemos presentado el problema de la diagonalización y 
vemos que no todos los operadores lineales ni todas las matrices son diago- 
nalizables. Aun cuando fuimos capaces de diagonalizar ciertos operadores 
y matrices e incluso obtuvimos una condición necesaria y suficiente para 
diagonalizabilidad (Teorema 5.4), no hemos resuelto el problema de la dia- 
gonalización. Lo que aún se necesita es una prueba sencilla para determinar 
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si un operador o matriz puede ser diagonalizado y, si es posible, tener un 
algoritmo para obtener una base de eigenvectores. En esta sección des- 
arrollaremos dicha prueba y un algoritmo. 

En el Ejemplo 7 de la Sección 5.1 obtuvimos una base de eigenvec- 
tores escogiendo un eigenvector correspondiente a cada eigenvalor. En ge- 
neral, este procedimiento no proporciona una base, pero el teorema 
siguiente muestra que cualquier conjunto construido de esta manera debe 
ser linealmente independiente. 


Teorema 5.10. Sea T un operador lineal en V y sean ħ, do, -.- > àx eigenvalores 
de T diferentes. Si X,, Xz, . . - , Xu SON elgenvectores de T tales que A; corres- 
ponda a x;(1 < j < k), entonces [X1, Xz, --- > xx} es linealmente indepen- 
diente. 


DEMOSTRACIÓN. Utilizaremos inducción matemática sobre el número k. 
Supóngase que k = 1. Entonces xı +0 ya que x, es un eigenvector, y 
entonces {xı} es linealmente independiente. Supóngase que el teorema se 
cumple siempre para k — 1 eigenvectores, donde k — 1 > 1 y que tenemos 


k eigenvectores Xi, ..., Xr correspondientes a distintos eigenvalores 
Ma «+, Az Deseamos demostrar que [Xi -.. , Xx) €S linealmente inde- 
pendiente. Supóngase que se tienen escalares a,, ... , dx tales que 
ax, +... + aXe = 0. (1) 
Aplicando T a ambos lados de la ecuación (1) obtenemos 
a T(x) +... + aT (xx) = A ÀX: +... t akàkXk =— O. (2) 


Ahora multiplicando ambos lados de la ecuación (1) por Az obtenemos 
AX 1 +... F akàkXk — 0. (3) 
Luego, restando la ecuación (3) de la ecuación (2) tenemos 


ai (à ES Ax) Xa +... + Ak-1 (Aga == Ak) Xk-1 = 0. 


Por la hipótesis de inducción {xı, ... , Xņy-1} es linealmente independiente; 
por lo tanto 

ala — Ak) = +... = dra lAa — Ae) = O. 
Como à, ... , A son distintos, se tiene que A; — A; 340 para 1<i< 
k— 1. Así a, = ... = Ox, = 0, de manera que la ecuación (1) se re- 
duce a dix, = 0. Como xx 70, ax = 0; por tanto, a, = ... = a= 0 y 
entonces (x,, ... , Xx) es linealmente independiente. Mi 


Corolario. Sea T un operador lineal en V, un espacio vectorial dimensionalmente 
finito de dimensión n. Si T tiene n eigenvalores distintos, entonces Y es 
diagonalizable. 


DEMOSTRACIÓN. Supóngase que T tiene n eigenvalores distintos As, ..., 
An Y Sean Xi, ... , Xa elgenvectores de T tales que A; corresponde a xj 
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para 1 <j <n. Por el Teorema 5.10 (x,, ..., Xn} es linealmente inde- 
pendiente y, como dim(V) =n, este conjunto constituye una base para V. 
Luego, por el Teorema 5.4, T es diagonalizable. MW 


Ejemplo 8. Sea 
(1 1 
a= (1 1) MR. 


El polinomio característico de A (y por tanto de L4) es 


sase Naa 
det(4 — 11) = det ( i raa 3. 


y por lo tanto los eigenvalores de L, son O y 2. Como L, es un operador 
lineal en el espacio vectorial bidimensional R?, concluimos del corolario 
anterior que L4 (y por tanto 4) es diagonalizable. 


Aun cuando el corolario del Teorema 5.10 proporciona una condición 
suficiente para la diagonalizabilidad, esta condición no es necesaria. De 
hecho, el operador identidad es diagonalizable, pero sólo tiene un eigen- 
valor, A = 1. 

Hemos visto que la existencia de eigenvalores es una condición nece- 
saria para la diagonalizabilidad. El siguiente resultado nos dice más. 


Teorema 5.11. Sea T un operador lineal diagonalizable en un espacio vectorial 


n-dimensional V, y sea f(t) el polinomio característico de T. Entonces f(t) 
se descompone en un producto de n factores, todos de grado 1; esto es, 
existen escalares M, ào, ... , àn (no necesariamente distintos) tales que 


AA (E) (t — An). 


DEMOSTRACIÓN. Supóngase que T es diagonalizable. Entonces existe una 
base 8 para V tal que [T] = D es una matriz diagonal. Si 


Ài O o0 
OA 0 
D a . . . , 

0 0 o. A, 

entonces 
A, — íf 0 0 

0 A, —t 0 
S = det(D — tI) = det 

0 0 <=. A, —! 


= (hi — Dz — (1,1 =D — ADA) UA). A 
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De este teorema es claro que si T es un operador lineal diagonalizable 
en un espacio vectorial n-dimensional que no tiene n eigenvalores distintos, 
entonces el polinomio característico de T debe tener ceros múltiples. Esta 
observación nos conduce a la definición siguiente. 


Definición. Sea à un eigenvalor de un operador lineal o de una matriz cuyo 


polinomio característico es f(t). La multiplicidad (algebraica) de A es el 
mayor entero positivo k para el que (t — A)* es un factor de f(t). 


Ejemplo 9. Sea 
1 1 0 
A=|0 1 3]- 
0 0 2 


Si f(t) es el polinomio característico de A, entonces f(t) = — (1 — 1)? 
(1 — 2). Por tanto à = 1 es un eigenvalor de A con multiplicidad 2 y 
A = 2 es un eigenvalor de A con multiplicidad 1. 


Si T es un operador lineal diagonalizable en un espacio vectorial V 
de dimensión finita, entonces existe una base 8 para V formada por eigen- 
vectores de T. Sabemos del Teorema 5.4 que [T]g es una matriz diagonal 
en la que los elementos de la diagonal son los eigenvalores de T. Como el 
polinomio característico de T es det([T]g — tI) se ve fácilmente que cada 
eigenvalor de T debe estar presente como un elemento de la diagonal de 
[T]g exactamente tantas veces como su multiplicidad. Por lo tanto f 
contiene tantos eigenvectores (linealmente independientes) correspondien- 
tes a un eigenvalor como la multiplicidad del mismo. Así vemos que el 
número de eigenvectores linealmente independientes correspondientes a un 
eigenvalor dado es muy importante para determinar cuándo un operador 
puede ser diagonalizado. Recordando del Teorema 5.9 que los eigenvec- 
tores de T correspondientes al eigenvalor A son los vectores no nulos en 
el espacio nulo de T — Al es necesario el estudio de este conjunto de 
manera natural. 


Definición. Sea T un operador lineal en un espacio vectorial V y sea à un eigen- 


valor de T. Defínase a Eri= {x€ V: T(x) = Ax) = N(T — Aly). El con- 
junto Er se denomina el eigenespacio de T correspondiente al eigenvalor A. 
Como es de esperarse, por eigenespacio de una matriz A entendemos el 
eigenespacio correspondiente del operador La. 


Es claro que E, es un subespacio de V que contiene al vector cero y a 
los eigenvectores de T correspondientes al eigenvalor A. El número de 
eigenvectores de T linealmente independientes correspondientes al eigenva- 
lor A es, por tanto, la dimensión de E,. Nuestro resultado siguiente rela- 
ciona esta dimensión con la multiplicidad de a. 
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Teorema 5.12. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Si A es un eigenvalor de T de multiplicidad m, entonces 
1 < dim(E) < m. 
DEMOSTRACIÓN. Tómese una base {x;, ... , Xp} para E, y extiéndase ésta 
a una base B = ([X,,..., Xp, Xps- - -> Xn} para V. Obsérvese que x;(1 < i 
<p) es un eigenvector de T que corresponde a A y sea A = [Tlg. En- 
tonces 


donde B, = Al, y O es la matriz cero. 
Por el Ejercicio 9 de la Sección 4.3, el polinomio característico de 
T es 


E me zn B, a tl, B, 
FC) = det(A — tln) = det ( EN aa 
= det(B, = tlp) A det(B, AS E 
Sea g(t) = det(B; — tl„-p) el polinomio característico de B. Se ve clara- 
mente que det(B, — tlp) = (A — t)? = (—1)”(1— A)”. Por lo tanto 
f(t) = (—1)"(1— A)”g(t), de manera que la multiplicidad de A es al 
menos p. Pero dim(E,) = p por lo que dim(E,) <m. E 


Ejemplo 10. Sea T: P.(R) => P,(R) el operador lineal definido median- 
te T(f) =f', la derivada de f. La matriz de T con respecto a la base 
8 = (1, x, x°} para P,(R) es 
0.1.0 
[TJ], =|0 O 2f 
00.0 


Consecuentemente el polinomio característico de T es 


—t 1 0 
det([T]; — tI) = def 0O —t 2] =-—+23, 
0 0 =t 


Entonces T tiene solamente un eigenvalor (A = 0) con multiplicidad 3. 
Luego Er = N(T — Al) = N(T). Por lo tanto Ea es el subespacio de P,(R) 
que contiene a los polinomios constantes. Y en este caso (1) es una base 
para Er y dim(E,) = 1. Consecuentemente no existe una base para P,(R) 
que conste de eigenvectores de T, de modo que T no es diagonalizable. 


Ejemplo 11. Sea T un operador lineal en R* definido mediante 
a, 4a, + a 
T a, == 2a, + 3a, + 2a, j 


a3 a; + 4a; 
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Determinaremos el eigenespacio de T correspondiente a cada eigenvalor. 
Si 8 es la base ordinaria para R?, entonces 


4 0 1 
1, =|2 3 2} 
10 4 
Por tanto el polinomio característico de T es 
4—t 0 1 
det([T]; — tI) = detf 2 3—t 2 ļ]=—(t— 5(t— 3). 
1 0 4—t 


De manera que los eigenvalores de T son A, = 5 y Az = 3 con multi- 
plicidades 1 y 2, respectivamente. 


Como 
Xi —1 0 WN /x, 0 
E, =N(T— åD =4[x2] € R?: 2 —2 2Nx,1=| 0 |)» 
X3 1 0 —1/1x, 0 


E, es el espacio de soluciones del sistema de ecuaciones 


—X1 + X3 == 0 
2x, — 2x, + 2x, = 0 
Xi — x, =0. 


Se ve fácilmente (utilizando las técnicas del Capítulo 3) que 


l 
2 
1 


es una base para E,,. De donde dim(E,,) = 1. 
De manera análoga Ea, = N(T — Az!) es el espacio de soluciones del 
sistema 


x+x3=0 

2x, +2x,=0 

x + x3=0. 
Y entonces 1 /0 
Off 1 
—1/ 0 


es una base para Ea, y dim(E,,) = 2. 
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En este caso la multiplicidad de cada eigenvalor A; es igual a la 
dimensión del eigenespacio correspondiente E,,. Obsérvese que 


1 1 0 
2 || 0| [1 
l —1 0 


es una base para R? que consta de eigenvectores de T. En consecuencia T 
es diagonalizable. 

Los Ejemplos 10 y 11 sugieren la siguiente conjetura: Si T es un 
operador lineal en un espacio vectorial dimensionalmente finito V tal que 
el polinomio característico de T se puede descomponer en un producto 
de factores de grado 1, entonces T es diagonalizable si y sólo si la multi- 
plicidad de cada eigenvalor es igual a la dimensión del eigenespacio de T 
correspondiente a ese eigenvalor. Esta conjetura es, de hecho, cierta, pero 
su demostración implica una complicación que aún no estamos prepa- 
rados para resolver. La dificultad es que aún no sabemos en general que 
la unión de las bases para cada uno de los eigenespacios será una base 
para V. (Este hecho estuvo claro dentro del contexto del Ejemplo 11 
pero el caso general no ha sido demostrado.) Nótese que el Teorema 5.10 
no es útil en este caso a menos que cada eigenespacio sea de dimensión 1. 
Así, debemos apartarnos un poco del problema de la diagonalización para 
establecer este hecho, el cual requerirá de la generalización del concepto 
de suma directa (tal como se definió en la Sección 1.3). Para este fin 
será conveniente expresar una suma de subespacios W,, W, ... , Wg (no 
necesariamente directa) como 


k 
> W.. 


Ía1 


Definición. Sean W,, W., ... , W, subespacios de un espacio vectorial V. Escri- 


biremos V = W, QW- @ ... O W, y llamaremos a V la suma directa de 
W,, Wo, o Wk si 


Wi N (ŒW) = (0) para cada i(1 <i <k). 
pi 


Ejemplo 12. Sea V = Rt y sean W, = ((a, b, 0, 0): a, bER}, W: = 
{(0, 0, c, 0): CER) y W, = {(0, 0, O, d): dE R}. Para cualquier 
elemento (a, b, c, d) de V 


(a, b, c, d) = (a, b, 0,0) + (0, 0, c, 0) + (0, 0, O, d) EW, + W: + W,. 


Luego entonces 
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Para demostrar que V es la suma directa de W,, W: y W, debemos de 
mostrar que W, N (W: + W:) = {0}, W2: N (W: + Wa) = (0) y W¿N 
N (W, + W2) = (0). Pero estas igualdades son evidentes; de modo que 
V=W,QW. Q W.. 


Nuestro resultado siguiente contiene varias condiciones que son equiva- 
lentes a la definición de suma directa. Nótese que este teorema contiene 
al Teorema 1.6 como un caso especial. 


Teorema 5.13. Sean W,, Wo, ... , Wk subespacios de un espacio vectorial di- 
mensionalmente finito V. Las siguientes condiciones son equivalentes: 


(a) 
(b) 


(e) 
(d) 


(e) 


V =W 0w 60 Ese SH Wi. 

V = 2 Wi y, para vectores X,, Xo,..., Xx cualesquiera tales 
que x: EW, (i= 1, 2,..., k), si X, + X: + ... + Xx =0, en- 
tonces X; = 0 (i = 1, 2,..., K). 

Cada vector v en V puede escribirse de manera única en la forma 
v=x +x: +... + Xx donde xi EWi(i = 1, 2,..., K). 


Si para toda i = 1, 2, ... , k, y; es una base ordenada cualquiera 
para W,, entonces yı U y2 U ... U yk* es una base ordenada 
para V. z 
Para toda i= 1, 2,..., k existe una base ordenada y; para 


W¡(i=1,2,...,K) tal que y U y2 U ... U yz es una base 
ordenada para V. 


DEMOSTRACIÓN. Si (a) es cierta entonces, por definición, 


k 
ial 
Supóngase que xı, X2, ... , Xx son vectores tales que x; EW: (i = 1, 2,..., 
k) y xı +x +... +x = 0. Entonces para cualquier i 


-x = Y xj € SW; 
jà 


ji 


Pero también 


=x; EW;, y así ~x: EW: N (X W;) = (0). 


pei 


Por lo tanto x; = 0, lo que demuestra a (b). 


Demostraremos en seguida que (b) implica a (c). Puesto que de 
acuerdo con (b) 


* 


k 
V=>NWw;, 


t=1 


Consideraremos a y, U y, U ... U Yẹ como una base ordenada de la mane- 


ra normal —los vectores de y, se enumeran primero (en el mismo orden que en y,), 
luego los vectores de y, (en el mismo orden que en y,), etc. 
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cualquier vector v €V puede ser representado en la forma v = x, + x, + 
- “E Xx para algunos elementos x;€ W:(i= 1, 2,..., k). Debemos 
demostrar que esta representación es única. Supóngase por tanto que 
v= y TF Ye +... + ya, donde y; E€W;(i= 1, 2,..., k). Entonces 


(xi = y) F E a 0 +... + (Xx — yx) = 0. 


Pero como x; — y; € W;, se deduce de (b) que x; — yı: =0(i=1,2,..., 
k). Luego x; = y; para cada i, lo que demuestra la unicidad de la repre- 
sentación. 

Para demostrar que (c) implica a (d), sea y; una base para W; (i = 1, 


2,..., k). Como de acuerdo con (c) 
k 
V = 5 Wi. 
¿=1 
es evidente que y, U y. U ... U yẹ genera a V. Supóngase que existen 
vectores xi¡E€Eyi(j=1,2,...,m¡ei=1,2,...,k) y escalares a;; tales 
que 
> Aij¡X ij T 0. 
ij 
Hágase 
J= DA 


Pel 
entonces y; EL(y:) =W; y 
Y; + ya + ed + Yk = D ajjxi; = 0. 
ij 
Puesto que 0 €W; para todaiy0+0+... EOS y tyt... E Yp 
la condición (c) implica que y; = O para toda i. Luego, 


Mi 


Q= p DO 
j=1 


para toda i. Pero como y; es linealmente independiente, se obtiene que 
di = 0 para j = 1, 2,... , m; y toda i. Por lo tanto nNnUyU... Uy 
es linealmente independiente y entonces es una base para V. 

Es inmediato que (d) implica a (e). 

Finalmente, demostraremos que (e) implica a (a). Si y; es una base 
para W;¡(¿=1,2,...,Xk) tal que y, U y. U ... U yz es una base para 
V, entonces 


V= Ely Uy U va U yr) 


= k 
L(y.) F L(y) Tao L(yx) = NW; 


%+=1 
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mediante sucesivas aplicaciones del Ejercicio 12 de la Sección 1.4. Fíjese 
un índice ¿ y supóngase que 
OXVEW;nN (2 W;). 
Entonces 
vEW;¡=L(yi) y v€ 2 W; = L(U y;). 
si ¡ei 
Por lo tanto v es una combinación lineal no trivial de y; y UY» de ma- 


nera que v puede expresarse como combinación lineal de y, U y: U ... U 
U yx en más de una manera. Pero esas representaciones contradicen al 
Teorema 1.9, por lo que se concluye que 


Wi N (È W;) = (0), 
jži 
demostrando (a). EW 


La razón para discutir sumas directas es para permitirnos demostrar 
que si T es un operador lineal diagonalizable en un espacio vectorial di- 
mensionalmente finito V, entonces la unión de las bases para cada uno 
de los eigenespacios de T es una base para V. El teorema anterior muestra 
que esta condición es equivalente a demostrar que, si T es diagonalizable, 
entonces V es la suma directa de sus eigenespacios. Ahora formalizaremos 
este importante resultado. 


Teorema 5.14. Sea T un operador lineal en un espacio vectorial n-dimensional 
V. Supóngase que el polinomio característico de T se puede descomponer 
en un producto de factores de grado 1 y sean M, Az, ... , A: los distintos 
eigenvalores de T. Entonces los siguientes incisos son equivalentes: 


(a) T es diagonalizable. 

(b) V=ELODEO... OD Er. 

(c) Si d; = dim(E,,) para 1<j<kK, entonces d, + d+... + 
+ dy =n. 

(d) Si m; es la multiplicidad de A; para toda ¡(1 < j < k), entonces 
dim(Er,) = m;(j = 1,2,..., K). 


DEMOSTRACIÓN. Primero demostraremos que (a) implica a (b). Si T 
es diagonalizable, entonces V tiene una base que consiste en eigenvectores 
de T, de donde se deduce fácilmente que 


k 
V=56,. 
i=1 
Sean x;€Er1,(1= 1,2,..., k) vectores tales que x, + x> +... + x= 0. 
Ahora bien, cada x; es o bien el vector nulo o un eigenvector de T corres- 
pondiente a à;. Como por el Teorema 5.10 el conjunto de estos vectores 
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no nulos x; es linealmente independiente, x, + x + ... + xx = 0 im- 
plica que xı = x: = ... = xX = 0. Luego, por el Teorema 5.13 V = Ex, @ 
DEn D... OE 


Si V= E, Q En 0... E entonces se infiere del Ejercicio 5 que 


k 
ni= dim(V) = 5 dim(E,,) = di + d; + ... + dy. 
i=1 
Así (b) implica a (c). 
Demostraremos ahora que (c) implica a (d). Supóngase que 


k 
5d; = n. 
Por el Teorema 5.12, d; < m; para toda j y por tanto 


k k 
n= X d; < X m. 
i=1 i=1 


Pero 


puesto que el polinomio característico se descompone en un producto de 
factores de grado 1. Luego, ya que 


k 
5X (m — d) =0 y m-d;> O0 
i=1 


para cada í, podemos concluir que d; = m; para cada i. 
Finalmente, demostraremos que (d) implica a (a). Supóngase que 
d; = dim(E,,) = m; para toda j y sea 


k 
W= 5 Exis 
i=1 
Un argumento similar al del primer párrafo de esta demostración muestra 
que W = E, @ En O -.. Q En. Si 2: es una base ordenada para Ea (i = 
= 1, 2,..., k), entonces de acuerdo con el Teorema 5.13 8, U fs, U 
U ... U Bk es una base para W. Pero B, U B2 U ... U By contiene 


k k 
X dim(E,,) = Nm =n 
i=1 i=1 
vectores y por lo tanto W = V. De modo que V tiene una base f, U 
Uf. U ... U Bx que está formada por eigenvectores de T. Luego T es 
diagonalizable, lo que demuestra (a). I 


Este teorema completa nuestro estudio del problema de la diagonali- 
zación. Resumiremos algunos de nuestros resultados anteriores en la prue- 
ba y en el algoritmo siguientes. 
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Una prueba para diagonalizabilidad 


Sea T un operador lineal en un espacio vectorial n-dimensional. Entonces 
T es diagonalizable si y sólo si se satisfacen las siguientes dos condiciones. 


l. El polinomio característico de T se descompone en un producto 
de factores de grado 1. 

2. La multiplicidad de A es igual a n — rango(T — Al) para cada 
eigenvalor A de T. 


Obsérvese que la condición 2 queda automáticamente satisfecha para 


eigenvalores de multiplicidad 1 (Teorema 5.12). Luego, la condición 2 
sólo debe verificarse para eigenvalores de multiplicidad mayor que 1. 


Un algoritmo para la diagonalización 


Sea T un operador lineal diagonalizable en un espacio vectorial dimensio- 


nalmente finito V y sean A,, ... , Ax los distintos eigenvalores de T. Para 
cada j, sea 8; una base para Ea, =N(T — Ajl) y sea BSB UB U 
U ... U Bx. Entonces 8 es una base para V, y [T]g es una matriz dia- 
gonal. 


Ejemplo 13. Probaremos si la matriz 


3 1 0 
A=|0 3 OJe M;.;(R) 
0 0 4 


es diagonalizable. Como la prueba anterior está enunciada para operadores 
lineales en vez de para matrices, aplicaremos la prueba al operador L4. 

El polinomio característico de L, es det(A — tI) = — (t — 4) (t — 3)?. 
Por lo tanto L, tiene como eigenvalores a A, = 4 y às = 3 con multipli- 
cidades respectivas 1 y 2. Claramente se satisface la condición 1 de la 
prueba de diagonalizabilidad y como A, tiene multiplicidad 1, la condi- 
ción 2 se satisface para A, por lo que sólo tenemos que verificar la con- 
dición 2 de la prueba para A.. Como 


0 1 0 
B=A-—d)JI=|0 0 0 
0 O0 1 


tiene rango 2, 3 — rango(B) = 1. Así, la condición 2 de la prueba falla 
para A. y en consecuencia L, y (por tanto 4) no es diagonalizable. 
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Ejemplo 14. Sea T: R* => R? definida mediante 


a — 2b — 3c 
Tlbl|=law+3b+3c|- 
c c 


Probaremos si T es diagonalizable. Siendo y la base estándar para R* 
tenemos 


> 


0 -2 -3 
M=|l1 3 3 
0 0 1 


El polinomio característico de T es — (t — 1)? (t — 2). Luego T tiene 2 
eigenvalores: A, = 1 con multiplicidad 2 y As = 2 con multiplicidad 1. 
Nótese que la condición 1 de la prueba para diagonalizabilidad queda 
satisfecha. Ahora consideraremos la condición 2. 

Para A, = 1, 


Sh 2 = 
3 — rano T = aa) = 3 = rango ( 1 2 s)=3-152 
0 0 0 


Luego la dimensión de E,, es la misma que la multiplicidad de A,. Como 
Az tiene multiplicidad 1, la dimensión de Ea, es igual a la multiplicidad 
de Az. Por tanto T es diagonalizable. 

Encontraremos ahora una base 8 para R? tal que [T]s sea una matriz 
diagonal. Dado que 


xX; == SN 
E, = NT == 4,1) = X2 € R?: 1 2 3 X| = 0 > 
X3 0 0 0/Xx, 


Er, es el conjunto de soluciones de 


E E TE 2x = 3x = 0 
xı + 2x: + 3x; = 0, 


que tiene como base a 


—2\ /—3 
Bi 11 0 
0 1 
También 
Xi —2 -2 —M/x, 
E, =N(T— 42D =4lx2] e R?: 1 1 3Nx,|=0»- 


X3 0 0 —1 X3 
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Luego Ea, es el conjunto de soluciones de 


—2x, — 2x, — 3x, =0 
xit x2+?%x=0 
— x3=0, 
que tiene como base a 
—1 
Bo FF 1 
0 


Sea 8 = 8, U Be, entonces 8 es una base para V y 


l 
[TJ, =[0 1 Of 
o 0 2 
Nuestro siguiente ejemplo es una aplicación de la diagonalización que 
será de interés en la Sección 5.3. 


Ejemplo 15. Sea 


0 E 
A= ( r 3): 

Demostraremos que A es diagonalizable y encontraremos una matriz Q 
de 2.x 2 tal que QAQ sea una matriz diagonal. Esta información será 
luego utilizada para calcular A” para cualquier entero positivo n. 

Recuérdese que A es diagonalizable si y sólo si L, es diagonalizable. 
Tenemos que el polinomio característico de L4 es (t— 1)(t — 2); por 
tanto, L, tiene dos eigenvalores diferentes y entonces La (y por tanto A) 
es diagonalizable. Para encontrar una base 8 para R? tal que [L,]g sea una 
matriz diagonal, nótese que L4 tiene como eigenvalores a A, = 1 y M~ = 2. 
Puede verse fácilmente que 


es una base para Er, y que 


1) 


es una base para E,,. Entonces para la base 


0-41) (1); 
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tenemos 
Además, si 


entonces, por el Teorema 5.1, 


1 0 
9-49 = (o 2): 
Finalmente, como 
(10 z 1 0 
Entonces 


eoh De] 


2 1N/1 O 1 1\ 2:= 2" LD 
da MA VR A A A El A 
Concluiremos esta sección con una aplicación que utilice la diagonali- 
zación para resolver un sistema de ecuaciones diferenciales. 


Ejemplo 16. Considerar el sistema de ecuaciones diferenciales 


xi = 3 + x2+ Xx 
x= 2x, + 4x, + 2x, 
MY Xd X, 
donde, para toda i, x; = x;(£) es una función diferenciable real, en la 


variable real t. Es evidente que este sistema tiene solución, que es la solu- 


ción en la que cada x;(t) es la función cero. Determinaremos todas las 
soluciones del sistema. 


Sea X: R—=>R* la función definida mediante 
x(t) 
X(1) =| x,(0) ]- 
x(t) 
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La derivada de X se define como la función X”, donde 
x(t) 
X(t) =|x20 | 
x3(t) 
Haciendo 


la matriz de coeficientes del sistema dado, podemos escribir este sistema 


en la forma matricial X’ = AX, donde AX es el producto matricial de 
A por X. 


El lector deberá verificar que A es diagonalizable y que si 


1 0 1 
O=| 0 1 21» 
—=1 -—1 —1 
entonces 
200 
O "A0O0=]|j0 2 0 
0.04 
Hágase 
200 
D=|0 2 0) 
0.04 


y sustitúyase A = QDQ en X’ = AX para encontrar X’ = ODOIX o, 
de manera equivalente, QX’ = DQ“X. Defínase a Y: R — R? mediante 
Y(t) = Q X(t). Puede demostrarse que Y es una función diferenciable 


y que, de hecho, Y” = YX”. Por lo tanto el sistema original puede es- 
cribirse como Y' = DY. 


Como D es una matriz diagonal, el sistema Y’ = DY es fácil de resol- 
ver. Puesto que para 


y(t) 
YA =| 1200 p 
y(t) 
entonces Y’ = DY puede escribirse como 


y1 (1) 2 0 0/0) 2y,(1) 


y An | =|0 2 0N ya) ] =| 2y,(0) ]- 
yt) 0 0 4/1 ya(t) 4y,(1) 
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Las tres ecuaciones 

yı) = 2y,(1) 

y(t) = 2y:(t) 

y) = Ayo) 
son independientes entre sí y por tanto pueden resolverse individualmente. 
Se ve fácilmente (como en el Ejemplo 2 de la Sección 5.1) que la solu- 


ción general de estas ecuaciones es y,(t) = c,e?*, y(t) = c¿e y y(t) = 
= ce*', donde c,, cz y c, son escalares cualesquiera. Finalmente 


x(t) 1 0 1\ /c,e? 
x(0) | =X(+) =0Y(0 =| 0 1 2 f ce” 
x(t) —1 —1 —1/YXc,e* 
ce” + ce" 
= ce” + 2ce“ 
—C,e* — ce” — ce" 


da la solución general del sistema original. Nótese que esta solución puede 
escribirse como 


1 0 1 
Xx) =e ced O0l+cl] 1 +elef 2 
—1 —1 —1 


Las expresiones en los paréntesis rectangulares son sencillamente elementos 
cualesquiera de Ea, y Ea, respectivamente, donde A, = 2 y Az = 4. Lue- 
go, la solución general del sistema original es X(t) = etz, + e*tz,, donde 
21 €En, y 22€ E», 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) 
(b) 
(c) 
(d) 


Cualquier operador lineal en un espacio vectorial n-dimensional que 
tiene menos de n eigenvalores distintos no es diagonalizable. 
Eigenvectores correspondientes al mismo eigenvalor son siempre li- 
nealmente dependientes. 


Si un espacio vectorial es la suma directa de subespacios Wi, Wa, ..., 
Wx, entonces W; N W; = (0) para i Æj. 
Si 


k 
V=NW, y WAW = {0} para i Æj. 


Y 
i=1 


entonces V = W, OW @... OW. 
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(e) Si A es un eigenvalor de un operador lineal T, entonces cada elemen- 
to de E, es un eigenvector de T. 

(f) Sia, y A, son eigenvalores distintos de un operador lineal T, entonces 
Er, N Er, = (0). 

(g) Sean A € Mun(F) y B= {x .-. , Xn} una base para F" formada de 
eigenvectores de A. Si Q es la matriz de n x n cuya columna i es 
x(i=1,2,..., n), entonces O*4Q es una matriz diagonal. 

(h) Un operador lineal T en un espacio vectorial dimensionalmente finito 
es diagonalizable si y sólo si la multiplicidad de cada eigenvalor A 
es igual a la dimensión de Ea. 

(i) Todo operador lineal diagonalizable tiene al menos un eigenvalor. 


Para cada una de las matrices siguientes A en Mnxn(R), probar si A es 
diagonalizable y, en caso de serlo, encontrar una matriz Q tal que Q*4Q 
sea una matriz diagonal. 


ob) w (2 


(dd) /7 -4 0 (o) 00 1 M / 1 
8 —5 0 1 0 -1 0 1 
6 —6 3 01 1 0 0 

0/3 11 

2 42 
<i a] 


Para cada uno de los siguientes operadores lineales T, probar si T es diago- 
nalizable y, en caso de serlo, encontrar una base 8 tal que [T]g sea una 
matriz diagonal. 


(a) T: P(R)—P,(R) definida mediante T(f) = f + f”, donde f' y f” 
son la primera y segunda derivadas de f, respectivamente. 

(b) T: Pa(R)— P (R) definida mediante T(ax? + bx + c) = cx? + 
+ bx + a. 

(c) T: R3— R? definida mediante 


a; a, 
T dz = —4; 
a; 2a, 


Demostrar la versión matricial del corolario al Teorema 5.10: Si A € Maxa (F) 
tiene n eigenvalores distintos, entonces Æ es diagonalizable. 


Sean W,, Wz, . .. , Wx subespacios de un espacio vectorial dimensionalmen- 
te finito V tal que 


ŽW. 3 
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11. 


12. 


13. 


14. 
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Demostrar que V es la suma directa de Wi, Wa, ... , Wk si y sólo si 
dim(V) = Ss dim(W;). 
í=1 
Sea V un espacio vectorial dimensionalmente finito con una base B= 1[x,, 


Xa, -s Xn}, y sea Br, Bo, ... , Br una partición de 8 (esto es, Bu SO 
Px son subconjuntos de 8 tales que 8 = 8, U B&U... U Br y hN B 


= Y sii = j). Demostrar que V = L(8:) DLL) B... OL(Ba). 
Enunciar y demostrar la versión matricial del Teorema 5.11. 


(a) Justificar la prueba de diagonalizabilidad y el algoritmo para diago- 
nalización enunciado en esta sección. 
(b) Enunciar el inciso (a) para matrices. 


Si 
1 4 
A = (> 3) EM (RD, 
encontrar A” para cualquier entero positivo n. 


Sea A €Mnx»a(F) tal que tenga dos eigenvalores distintos A, y Az. Si 
dim(E,,) = n — 1, demostrar que A es diagonalizable. 


Sea T un operador lineal en un espacio vectorial V dimensionalmente finito 
para el cual los distintos eigenvalores de T son Ar Az... , Az. Demostrar 
que 


L((x€ V: x es un eigenvector de T)) = EADE... DE. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
para el cual los distintos eigenvalores ài, A», ... , Az se presentan con multi- 
plicidades m,, Ma, ..., My, respectivamente. Si 8 es una base para V 
tal que [T]¿ es una matriz triangular, demostrar que los elementos de la 
diagonal de [T]¿ son A,, A», ... , Ax y que cada A; aparece m; veces (j = 1, 
SS E 


Supóngase que A es una matriz de n x n cuyo polinomio característico se 
descompone en un producto de factores de grado 1 y que los distintos eigen- 
valores de A son ài, Az, ... Az. Para cada j, sea m; la multiplicidad de aj. 
Demostrar que 


k 
tr(4) = X ma). 
Jen 


Sea T un operador lineal invertible en un espacio vectorial dimensionalmen- 
te finito. Demostrar que T es diagonalizable si y sólo si T- es diagonalizable. 
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15. Sea AEMnin(F). Demostrar que A es diagonalizable si y sólo si A* es 
diagonalizable. 


16. Encontrar la solución general del sistema de ecuaciones diferenciales. 


o = 8x, + 10x: 


x, = — Xy a Tx. 
17. Sea 
411 Ar *** Ain 
A21 A22 *** An 
A = 
anı an2 a Ann 


la matriz de coeficientes del sistema de ecuaciones diferenciales 


Xi = 11X1 + Q19X2 F *** F Qj,X, 
X3 = 021X1 + 32X2 + +** F ArnXn 
Xn => An1X y + An2X2 ER AS ale AnnXn' 


Supóngase que A es diagonalizable y que los distintos eigenvalores de A 
son Ax, Az, ..- , Ax. Demostrar que una función diferenciable X: R — R" 
es una solución del sistema si y sólo si X es de la forma 


X() = etz, + atz +... + etz, 


donde z; €E}, para i = 1, 2,... k. Conclúyase que el conjunto de solu- 
ciones del sistema es un espacio vectorial real n-dimensional. 


Los Ejercicios 18-20 se ocuparán del tema de la diagonalización simultánea. 


Definiciones. Dos operadores lineales T y U en el mismo espacio vectorial di- 
mensionalmente finito V se denominan simultáneamente diagonalizables si 
existe una base B para V tal que [Tlg y [Ulg son ambas matrices diagonales. 
De la misma manera A, B E€EMnxn(F) se llaman simultáneamente diagonali- 
zables si existe una matriz invertible Q €M, ;.(F) tal que QAQ y Q BO 
son ambas matrices diagonales. 


18. (a) SiT y U son operadores lineales simultáneamente diagonalizables en 
un espacio vectorial dimensionalmente finito V, demostrar que [Tlf 
y [U]g son matrices simultáneamente diagonalizables para cualquier 
base £. 


268 


19. 


20. 
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(b) Demostrar que si A y B son matrices simultáneamente diagonalizables, 
entonces La y Lg son operadores simultáneamente diagonalizables. 


(a) Demostrar que si T y U son operadores simultáneamente diagonaliza- 
bles, entonces T y U conmutan: es decir, TU =UT. 

(b) Demostrar que si A y B son matrices simultáneamente diagonaliza- 
bles, entonces A y B conmutan. 


Las recíprocas de (a) y (b) se establecerán en el Ejercicio 11 de la 
Sección 5.4. 


Sea T un operador lineal diagonalizable en un espacio vectorial dimensional- 
mente finito y sea m cualquier entero positivo. Demostrar que T y T™ son 
simultáneamente diagonalizables. 


Sean W,, Wa, Ki, Kz, ... , Kp Ma, Mo, ..., Mg subespacios de un espacio 
vectorial V tales que W, =K, OK. ...OK,yW.»=M,0M.0D...0 
M, Demostrar que si W, N W, = (0), entonces W, + W: =W, Y) 
OW=KOK0...OKOMOMO... QM. 


5.3* LIMITES DE MATRICES Y CADENAS DE MARKOV 


Si A es una matriz cuadrada con elementos complejos, entonces ,para cual- 
quier entero positivo m, A” es una matriz cuadrada del mismo tamaño 
y que también tiene elementos complejos. En muchas de las ciencias na- 
turales y de la vida existen aplicaciones prácticas de importancia 
que requieren de la determinación del “límite” (si existe alguno) de la 
secuencia de matrices A, A?, A3, ... En esta sección consideraremos tales 
límites y examinaremos una situación importante en la que surge esta 
clase de límites. 


Definiciones. Sean L, A,, Az, Az, ... matrices de n x p con elementos com- 


plejos. Se dice que la sucesión A,, A,, Az, ... converge a la matriz L, 
denominada el límite de la sucesión, si para cada i (1<i<nm) y 
JA <j <p) la sucesión de números complejos (A,);;, (Az) is, (As)i;... 
converge a L;;. (El límite de la sucesión de números complejos {Zm: 
m = 1,2, ...), donde Zm = Im + iSm siendo Im y Sm números reales, que- 
da definido en términos de los límites de la sucesión de las partes real e 
imaginaria como 

lim Zn = (lim rm) + ¡(lim Sm).) 

m° mo n>% 
Para expresar el hecho de que la sucesión A,, A», As, ... converge a L, 
debemos escribir lim Am = L. 


m>o 


Límites de matrices y cadenas de Markov 269 


Ejemplo 17. Si 


la CP mpat) 


Ám == i i 1 > 
(+) 4 (+ 
entonces 
l O Bj 
e An = (o 2 e ) 


donde e es la base de los logaritmos naturales. 


Una sencilla pero muy importante propiedad de los límites de las 
matrices está contenida en el teorema siguiente. Nótese la analogía con la 
propiedad ordinaria de límites de sucesiones de números reales que asegura 
que si lim a,, existe, entonces 


lim Cam = c(lim am). 


m>oe m>o 


Teorema 5.15. Sea A,, Az, Ay, ... una sucesión de matrices de n x p con 
elementos complejos tales que 


lim Am = L € Maxp(C). 


m>o 


Entonces para cualquier BEM,.n(C) y CEMpxs(C), 
lim BA, = BL y lim A, C = LC. 


mw n >% 


DEMOSTRACIÓN. Para cualquier i(1 <i <r) y jQ <j<p), 


lim [(BA..):¡] = lim È BalAn)u | 


ma m> | k=1 
= Y Br{lim [(4m)151) = Y BixLxj = (BL)i;. 
k=1 mo k=1 


Por lo tanto lim BA, = BL. La demostración de que lim AmC = LC es 


semejante. E 


Corolario. Sea AEM,xn([C) y sea lim A" = L. Entonces para cualquier matriz 
invertible Q EMain(C), mie 


lim (QAQ)” = QLQ™. 


m>o 


DEMOSTRACIÓN. Puesto que 


(Q4AQ0”)” = (Q40”)(Q40”)...(Q40”) = QA"Q”, 
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tenemos, de acuerdo con el Teorema 5.15, que 


lim [((QAQ>*)”] = lim (Q4”Q”) = Q(lim 4”)Q” = QLO”. E 
m>o m>» mon 
El siguiente resultado importante proporciona las condiciones necesa- 
rias y suficientes para la existencia de la clase de límite que estamos consi- 
derando. 


Teorema 5.16. Sea A una matriz cuadrada con elementos complejos. Entonces 


lim A" existe si y sólo si se satisfacen las condiciones siguientes. 


(a) Si A es un eigenvalor de A, entonces |x| < 1. 

(b) Si à es un eigenvalor de A tal que |1| = 1, entonces à es el 
número real 1. 

(c) Si 1 es un eigenvalor de A, entonces la dimensión del eigenes- 
pacio correspondiente a 1 es igual a la multiplicidad de 1 como 
eigenvalor de A. 


Desafortunadamente no será posible demostrar la suficiencia de estas 
condiciones ni la necesidad de la condición (c) hasta que estudiemos la 
forma canónica de Jordan. Por esta razón la demostración del teorema será 
pospuesta hasta la Sección 6.2 (Ejercicio 18). Sin embargo, la necesidad 
de las dos primeras condiciones se infiere fácilmente del hecho de que 
lim A” si y sólo si à = 1 o bien [A|< 1. (Puede demostrarse que este 


mo 


caso, que sin duda el lector conoce para los números reales A, también 
se cumple para los complejos.) Supóngase entonces que A es un eigenvalor 
de A para el que las condiciones (a) y (b) fallan, esto es, tal que 
lA] > 1 o bien que |A|= 1 pero A1. Sea x un eigenvector de 4 
que corresponda a A. Considerando a x como una matriz de n x 1 ve- 
mos que, de acuerdo con el Teorema 5.15, 

lim (4”x) =(lim A”")x = Lx, 


mo m>oo 


donde L = lim 4”. Pero lim (4”x) = lim (A”x) es divergente puesto 
m>o mw m> o 
que lim A” no existe. Por lo tanto si lim A” existe, entonces las condi- 
m>» m> 2 


ciones (a) y (b) del Teorema 5.16 deben satisfacerse. Aun cuando en 
este momento no seamos capaces de demostrar la necesidad de la tercera 
condición, consideremos un ejemplo en el que esta condición falle. Obsér- 


vese que para la matriz 
_ {1 1 
aali 


el eigenvalor à = 1 tiene multiplicidad 2, mientras que dim(E1) = 1. 
Pero por inducción simple 

m/l m 

PE (o o) 
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y por lo tanto lim B” no existe. (Veremos más adelante que si Æ es una 


maz 
matriz para la que la condición (c) falla, entonces puede escogerse la 
forma canónica de Jordan de A de forma tal que su submatriz izquierda 
superior de 2 x 2 sea justamente esta matriz B.) 

Sin embargo, en la mayor parte de las aplicaciones que involucran este 
tipo de límite, la matriz A es diagonalizable. Cuando la condición (c) del 
Teorema 5.16 se sustituye por la condición de mayor fuerza de que A 
es diagonalizable (ver el Teorema 5.14), entonces se puede demostrar 
fácilmente la existencia del límite. 


Teorema 5.17. Sea A€EM,,n(C) tal que las condiciones siguientes se satis- 
facen: 


(a) Si à es un eigenvalor de A, entonces |à | < 1. 

(b) Si à es un eigenvalor de A tal que | à| = 1, entonces à es el 
número real 1. 

(c) A es diagonalizable. 


Entonces existe lim A". 
DEMOSTRACIÓN. Como A es diagonalizable, existe una matriz invertible 
O tal que QAQ = D es una matriz diagonal. Sea 


lio 0 0-0 
A A 
D = . . 
0.0 -- A 
Dado que ài, A», ... , A, son los eigenvalores de A, las condiciones (a) 


y (b) muestran que à;'= 1 o bien |à; | < 1 para 1 < i < n. Por lo tanto 


lim à” = le si Ai =1 


f 0 en cualquier otro caso. 
mo 
Pero como 

Aar O >- 0 

0 A7 0 

D" = . . . j 

0 0 irass V Ba 

la sucesión D, D?, D”, ... converge a un límite L. Por lo tanto, por el 


corolario del Teorema 5.15, 


lim 4” = lim (QDQ`)” = OLO”. E 


mxs 
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La técnica para calcular lim A”, utilizada en la demostración del teore- 


m>o 


ma anterior, es de gran utilidad. Utilizaremos este método para calcular 
lim A” para la matriz 


e 
=|4 4 4) 
a a a 
Si 
Bol 
O=|-3 -2 1) 
2 %3- 
entonces 
-10N/1-3-h A 00 
D=0(40)=|—1 1 24-3 ı 4]=f[0 —4 o]. 
E UN E Y NO 004 


Por lo tanto 
lim 4” = lim (Q0DO”)” = lim (Q0D”O0=) = O(lim D”)QOQ” 


E Sel 1 0 0\]/—1 0 1 
=|-3 —2 1|tiimlo (—p” 0 ]l-1 1 2 

2 3—1 \o 0o œ@”/]\-5 3 7 

1 3 -—n/1 0 01/-1 0 1 -1 0 1 
sfasa llo o olle 1 2 el 3 03] 

2 3 —1/\0o 0 0/\—5 3 7) \2 0 2 


Consideremos ahora un ejemplo sencillo en el que se presenta el límite 
de las potencias de una matriz. Supóngase que la población de cierta área 
metropolitana se mantiene constante pero que hay un movimiento 
continuo de gente entre la ciudad y los suburbios. Específicamente, sean 
los elementos de la siguiente matriz Æ las posibilidades de que alguien 
que vive en la ciudad o en los suburbios el primero de enero estará vivien- 
do en cada región el primero de enero del año siguiente. 


Viven Viven 
actualmente actualmente 

en la en los 
ciudad suburbios 


I! 
A 


Vivirán el próximo año en la ciudad 0.90 0.02 
Vivirán el próximo año en los suburbios ( 0.10 0.98 
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Entonces, por ejemplo, la probabilidad de que alguien que vive en la 
ciudad (el primero de enero) estará viviendo en los suburbios el próximo 
año (el primero de enero) es 0.10. Nótese que como los elementos de 
cada columna de A representan las probabilidades de residencia en cada 
uno de los dos sitios, los elementos de A son no negativos. Más aún, la 
suposición de una población constante en el área metropolitana requiere 
que la suma de los elementos de cada columna de A sea 1. Cualquier ma- 
triz que tenga estas dos propiedades (que los elementos sean no negativos 
y que la suma de los elementos de cada columna sea 1) se llama matriz 
de transición (o matriz estocástica). Para una matriz de transición M de 
n x n arbitraria, los renglones y las columnas corresponden a n estados 
y el elemento M;, representa la probabilidad de pasar del estado j al esta- 
do į en una etapa. En nuestro ejemplo, se tienen dos estados (residir en 
la ciudad y residir en los suburbios), y A», representa la probabilidad 
de emigrar de la ciudad a los suburbios en una etapa (año). 
Determinemos ahora la probabilidad de que un residente de la ciudad 
esté residiendo en los suburbios después de dos años. Obsérvese primero 
que hay dos maneras diferentes en las que tal cambio puede haberse rea- 
lizado —ya sea permaneciendo en la ciudad un año y después mudándose 
a los suburbios, o mudándose a los suburbios durante el primer año y 
permaneciendo en ellos en el segundo (véase Fig. 5.3). La probabilidad 
de que un habitante de la ciudad permanezca en la ciudad el siguiente año 
es 0.90 y la probabilidad de que un habitante de la ciudad se mude a los 
suburbios durante el próximo año es de 0.10. Por lo tanto, la probabi- 
lidad de que un residente de la ciudad permanezca en la ciudad durante 
un año y se mude a los suburbios durante el siguiente es 0.90 (0.10). 
De la misma manera, la probabilidad de que un habitante de la ciudad 
se mude a los suburbios durante el primer año y permanezca ahí durante 
el siguiente es 0.10(0.98). De este modo la probabilidad de que un resi- 
dente de la ciudad esté viviendo en los suburbios después de 2 años es 
0.90(0.10) + 0.10(0.98) = 0.188. Obsérvese que este número se obtuvo 


0.10 
Ciudad ——-———————= Suburbios 


Ciudad 


Suburbios GE Suburbios 


figura 5.3 
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mediante la misma operación que la que produce (A?)»,; por lo tanto 
(A4?)7, representa la probabilidad de que un habitante de la ciudad esté 
residiendo en los suburbios después de dos años. En general, para cual- 
quier matriz de transición M (M”);; representa la probabilidad de pasar 
del estado j al estado į en m etapas. 

Supóngase además que 70% de la población de 1970 del área metro- 
politana vivía en la ciudad y 30% vivía en los suburbios. Registremos esta 
información como un vector columna: 


Proporción de habitantes de la ciudad 0.70\ _ P 
Proporción de residentes de los suburbios \ 0.30 ` 


Nótese que los renglones de P corresponden a los estados de residir en la 
ciudad y de residir en los suburbios, respectivamente —el mismo orden 
en que los estados están registrados en la matriz de transición 4. Obsér- 
vese también que P es un vector columna que contiene elementos no 
negativos cuya suma es 1; tal vector se denomina vector de probabilidad. 
En esta terminología cada columna de una matriz de transición es un 
vector de probabilidad. 

Consideremos ahora el significado del vector AP. La primera coorde- 
nada de este vector está formada por la operación 0.90(0.70) + 0.02 
(0.30). El término 0.90(0.70) representa la proporción de la población 
metropolitana de 1970 que permaneció en la ciudad durante el siguiente 
año, y el término 0.02(0.30) representa la proporción de la población 
metropolitana de 1970 que se mudó a la ciudad durante el año siguiente. 
Por lo tanto, la primera coordenada de AP representa la proporción de 
la población metropolitana que vivía en la ciudad 1 año después de 1970. 
De la misma manera la segunda coordenada de 


_ (0.636 
ca (asa) 


representa la proporción de la población metropolitana que vivía en los 
suburbios en 1971. Este argumento puede extenderse fácilmente para de- 
mostrar que las coordenadas de 


PERU e 


0.42032 


representan las proporciones de la población metropolitana que estaban 
viviendo en cada uno de los sitios en 1972. En general, las coordenadas 
de 4”P representan la proporción de la población metropolitana que vivi- 
rá en la ciudad y en los suburbios, respectivamente, después de m etapas 
(m años después de 1970). 

¿Si esta tendencia continúa se vaciará la ciudad? En vista de lo antes 
expuesto es natural definir la proporción eventual de habitantes de la 
ciudad y de los suburbios como la primera y segunda coordenadas, res- 
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pectivamente, de lim A”P. Calculemos este límite. Utilizando la notación 
anterior as 


D = 0-140 = E ls ee i e hi 0 ) 
2 —4/\0.10 0.98/\5 —1 0 0.88 
luego entonces 


L = tim 4” = lim (@D"0=) = Q( jes E :) 


Por lo tanto 
lim 4”P = LP = (2) 


de manera que % de la población vivirá en la ciudad y % de la población 
vivirá en los suburbios. Es fácil demostrar que en este ejemplo 


-i 


para cualquier vector de probabilidad P. ¡Por lo tanto en este ejemplo las 
proporciones eventuales de habitantes de la ciudad y de los suburbios son 
independientes de las proporciones iniciales (dadas por el vector P)! 

Al analizar el problema ciudad-suburbios dimos interpretaciones pro- 
babilistas de 4? y de AP, demostrando que 4? es una matriz de transi- 
ción y AP es un vector de probabilidad. Se pueden utilizar argumentos 
semejantes para demostrar que el producto de dos matrices de transición es 
una matriz de transición y que el producto de una matriz de transición 
por un vector de probabilidad es un vector de probabilidad. Una demostra- 
ción alternativa de estos resultados puede basarse en el teorema siguiente, 


que caracteriza a las matrices de transición y a los vectores de proba- 
bilidad. 


Teorema 5.18. Sea M una matriz de n x n con elementos (reales) no negativos, 
sea X un vector columna en R" de coordenadas no negativas y sea u ER» 
el vector columna en el que todas las coordenadas son iguales a 1. En- 
tonces: 


(a) M es una matriz de transición si y sólo si Mtu = u. 
(b) xes un vector de probabilidad si y sólo si utx = (1). 


DEMOSTRACIÓN. Ejercicio. 


Corolario. 


(a) El producto de dos matrices de transición de n x n es una ma- 
triz de transición de n x n. En particular, cualquier potencia 
de una matriz de transición es una matriz de transición. 
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(b) El producto de una matriz de transición por un vector de pro- 
babilidad es un vector de probabilidad. 


DEMOSTRACIÓN. Ejercicio. 


Un proceso estocástico tiene como finalidad predecir el estado de un 
objeto que esté restringido a estar exactamente en uno de ciertos posibles 
estados en un instante dado cualquiera, pero que cambia de estado de 
alguna manera aleatoria. Normalmente, la probabilidad de que el objeto 
se encuentre en un estado particular en un instante dado dependerá de 
factores tales como: 


1. El estado en cuestión. 
El instante en cuestión. 

3. Algunos o todos los estados anteriores en los cuales estuvo el 
objeto. 

4. Los estados en los que se encuentran otros objetos o en los que 
se hayan encontrado. 


Por ejemplo, el objeto podría ser un votante americano y el estado 
del objeto podría ser su preferencia por algún partido político, o el objeto 
podría ser una molécula de H.O y los estados podrían ser los estados 
físicos en los cuales el H,O puede existir (los estados sólido, líquido y 
gaseoso). En estos ejemplos los cuatro factores antes mencionados influen- 
ciarán la probabilidad de que los objetos se encuentren en un estado par- 
ticular en un instante particular. 

Sin embargo, si la probabilidad de que un objeto que está en un estado 
cambie a otro estado diferente depende únicamente de los dos estados 
(y no del tiempo, estados anteriores u otros factores), entonces el proceso 
estocástico se denomina proceso de Markov. Además, si el número de 
estados posibles es finito, entonces el proceso de Markov se llama cadena 
de Markov. El ejemplo anterior del movimiento de población entre la 
ciudad y los suburbios es urna cadena de Markov de dos estados. 

Consideremos otra cadena de Markov. Un cierto plantel de bachillerato 
desearía obtener información sobre la probabilidad de que se gradúen las 
distintas clases de estudiantes actualmente inscritos. La escuela clasifica a 
un estudiante como de segundo o de primer grado dependiendo del núme- 
ro de créditos que el estudiante haya contabilizado. Los datos con que 
cuenta la escuela indican que de un semestre de otoño al siguiente se 
graduará el 40% de los estudiantes de segundo año, el 30% continuará 
en el mismo grado, y el 30% abandonará los estudios definitivamente. 
Para los de primer año, los datos muestran que el 10% se graduará para 
el próximo otoño, 50% pasará al segundo grado, 20% permanecerá en el 
mismo grado y 20% abandonará definitivamente la carrera. En este año 
el 50% de los estudiantes de la escuela son de segundo grado y el 50% 
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de primer grado. Suponiendo que la tendencia indicada por los datos se 
prolonga indefinidamente, la escuela desearía saber 


1. El porcentaje de los actuales estudiantes que se graduará, el por- 
centaje de los que pasarán a segundo grado, el porcentaje de los 
que estarán en el primer grado y el porcentaje de los que aban- 
donarán definitivamente para el próximo otoño. 

2. Los mismos porcentajes que en el inciso 1 para el semestre de 
otoño de aquí a 2 años. 

3. El porcentaje de sus estudiantes actuales que eventualmente se 
graduará. 


El párrafo anterior describe a una cadena de Markov de cuatro esta- 
dos que son: 


Haberse graduado. 

Estar en el segundo grado. 

Estar en el primer grado. 

Haber abandonado definitivamente. 


BPT 


Los datos antes mencionados nos proporcionan la matriz de tran- 
sición 

1 0.4 0.1 

0 0.3 0.5 

0 002 

0 0.3 0.2 


=- O © Q 


de la cadena de Markov. (Nótese que los estudiantes ya graduados o que 
han abandonado de una manera definitiva se considera que permanecen 
de una manera indefinida en sus estados respectivos, por lo que un estu- 
diante del primer grado que abandona la escuela y que regresa semestres 
después, no se considera que haya cambiado de estado, se supone que 
el estudiante permaneció en el estado de ser de primer grado durante el 
tiempo que no se inscribió.) Además, se nos informa que la distribución 
actual de los estudiantes es tal que la mitad de ellos se encuentra respec- 
tivamente en los estados 2 y 3 y ninguno en los estados 1 y 4. El vector 


0 
0.5 
0.5 

0 


que describe la probabilidad inicial de estar en cualquier estado se llama 
vector de probabilidad inicial para la cadena de Markov. 
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Con el objeto de resolver la primera pregunta debemos determinar la 
probabilidad de que un estudiante actual esté en cualquiera de los estados 
para el próximo otoño. Como se vio anteriormente, estas probabilidades 
están dadas por las coordenadas del vector 


0.25 
0.40 
0.10| 
0.25 


AP = 


Por lo tanto, para el próximo otoño, el 25% de los estudiantes actuales 
se graduará, el 40% estará en el segundo grado, el 10% estará en el 
primer grado y el 25% abandonará la escuela. De la misma manera 
0.42 

0.17 

0.02 

0.39 


A?P = A(AP) = 


proporciona la información requerida para resolver la pregunta 2: dentro 
de dos años el 42% de los estudiantes actuales se graduará, el 17% estará 
en el segundo grado, 2% estará en el primer grado y el 39% abandonará 
la escuela. 

Finalmente, la respuesta a la pregunta 3 la proporciona el vector LP, 
donde L = lim A”. El lector deberá verificar que si 


1-4 190 
0 7 —40 0 
“=lo o sgo 
0 —3 131 
entonces 
1 4 27 Q 04 0.1 0/1 —4 190 
SETE: 0.3 0.5 ollo 7 —40 0 
o 0o 4 ollo o 02 ollo o 30 
o3 22 1/\0 03 02 1/0 -3 Bı 
1 0 
0 0 
i 
0 
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De donde 
L = lim A” = Q(lim D”)O”! 


m-»o00 


1-4 19 0/1 000/1422 Q 144o 
o 7 -40 ollo o o ojo 4 3 oj foo o0 0 
fo o 3 ojlo o o oloo 4 of joo oo 
0-3 13 1/00 00 1/00 34 2 1 03 R I 
De este modo 59 
0 
LP=| ¿| 


y por lo tanto la probabilidad de que uno de los actuales estudiantes se 
gradúe es de 5%:12. 
En los dos ejemplos anteriores hemos visto que lim A”P, donde A 


m.o0o 


es la matriz de transición y P es el vector de probabilidad inicial de la 
cadena de Markov, permite conocer las proporciones eventuales en cada 
estado. En general, sin embargo, no es necesario que exista el límite de 
las potencias de una matriz de transición. Por ejemplo, si 


_[fO 1 
mM=(1 0) 
es evidente que lim M” no existe. (Potencias impares de M son iguales 


m>» 
a M, y potencias pares de M son iguales a 7.) La razón por la cual el límite 
no existe, es que la condición (b) del Teorema 5.16 no se satisface para 
M (—1 es un eigenvalor). De hecho, puede demostrarse (véase Ejercicio 
20 de la Sección 6.2) que las únicas matrices de transición A tales que 
lim A” no existe son precisamente aquellas matrices en las que la condi- 


me 
ción (b) del Teorema 5.16 no se cumple. 

Pero aun cuando exista el límite de las potencias de la matriz de 
transición, el cálculo de dicho límite puede llegar a ser muy difícil. (Se 
sugiere al lector realizar el Ejercicio 6 para comprobar la verdad de la 
última oración.) Afortunadamente, existe una clase de matrices de tran- 
sición grande e importante para las cuales el límite existe y es fácil de 
calcular —esta es la clase de matrices “regulares” de transición. 


Definición. Si alguna potencia de una matriz de transición contiene únicamente 


elementos positivos, entonces la matriz se llama matriz regular de tran- 
sición. 
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Ejemplo 18. La matriz de transición 


0.90 o) 
0.10 0.98 


de la cadena de Markov que describe el movimiento de población entre 
la ciudad y los suburbios es claramente regular puesto que todos los ele- 
mentos son positivos. Por otra parte, la matriz de transición 

1 04 0.1 0 


y [0 03 05 0 
10 0020 


0 03 0.2 1 


de la cadena de Markov que describe las inscripciones del plantel de bachi- 
llerato no es regular. (Es fácil demostrar que la primera columna de A” 
es 


1 
0 
0 
0 


para toda m; de donde (4”),,, por ejemplo, no es nunca positiva.) 
Obsérvese que una matriz regular de transición puede contener elemen- 
tos nulos; por ejemplo, 


09 05 0 
M=| 0 05 0.4 
0.1 0 06 


es regular puesto que todos los elementos de M? son positivos. 
En el resto de esta sección nos dedicaremos principalmente a demos- 
trar que si A es una matriz regular de transición, entonces existe L = lim A” 


E 
y las columnas de L son idénticas. (Recuérdese la forma de L en el 
problema ciudad-suburbio.) Con este hecho será fácil calcular el límite. 
Durante el transcurso de la demostración de este resultado obtendremos 
algunos teoremas interesantes sobre la magnitud de los eigenvalores de 
cualquier matriz cuadrada. Estas cotas estarán dadas en términos de la 
suma de los valores absolutos de los elementos de los renglones y de las 
columnas de la matriz. La terminología necesaria se introduce en la defini- 
ción siguiente. 


Definiciones. Sea A€EM,,.(C). Definase a pi(A) como la suma de los valores 


absolutos de los elementos del renglón i de A y v¡(A) como la suma de 
los valores absolutos de los elementos de la columna j de A. Entonces 


pi(A) = YN Aj] parai=1,2,...,n 
301 
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y 
v(A) = N/A! para j= 1, 2,..., N. 
j=1 


La suma de renglones de A, denotada por p(A), y la suma de columnas 
de A denotada por v(A), se definen como 


p(A) = max [o (A): 1<i<n) y »(A) = max (v¡(A): 1<j<n). 


Ejemplo 19. Para la matriz 


l -—1 5 
A =|-4 0 6 |» 
3 2 —l 


AA) = 7, (A) = 10, p(4) = 6, vn(4) = 8, v(d4)=3 y vn(4) = 
= 12. Por lo tanto p(4) = 10 y v(4) = 12. 


Nuestros siguientes resultados muestran que el menor de entre p(A) 
y v(A) es una cota superior para el valor absoluto de los eigenvalores 
de A. En el ejemplo anterior, por ejemplo, A no tiene ningún eigenvalor 
cuyo valor absoluto sea mayor de 10. 


Teorema 5.19. Sea à un eigenvalor de A €Mnxs (C). Entonces |à | < p(A). 


DEMOSTRACIÓN. Sea 


da un eigenvector de A para el que A es el eigenvalor correspondiente. Enton- 
a ces x satisface la ecuación matricial Ax = Ax que puede ser escrita como 
í el sistema de ecuaciones lineales 


S Aux = Axi Cae 2 ss Me (4) 


j=1 


Supóngase que x, es la coordenada de x que tiene el mayor valor absoluto 


y sea b = | xx |. De la k-ésima ecuación de (4) tenemos 
jalb = Jaj a| = [Ax] =1 2 Aix] < E | Arx; | 
Fst j=1 


(5) 


! 


PE 


Š | Au 11 < Š 144 |b = 40 < p(A)b. 


Pero como x que es un eigenvector no nulo, b-40. Luego, dividiendo 
ambos lados de la ecuación (5) por b, se obtiene | à | < p(4). E 
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Corolario 1. Sea à un eigenvalor de A € M,,n(C). Entonces |à] < min (p(A), 
v(A)). 


DEMOSTRACIÓN. Como por el Teorema 5.19 [à| < p(4), es suficiente 
demostrar que |à | < v(4). 

El Ejercicio 14 de la Sección 5.1 muestra que A es un eigenvalor de 
A*. Por lo tanto, de acuerdo con el Teorema 5.19 | à| < p(4*). Pero los 
renglones de A* son las columnas de A. Por lo tanto p(A*) = v(A), y 
así A | < v(A). E 


Como la suma de los elementos de las columnas de una matriz de tran- 
sición es 1, se obtiene de inmediato la siguiente conclusión a partir del 
Corolario 1. 


Corolario 2. Si A es un eigenvalor de una matriz de transición, entonces 
la] <1. 
El siguiente resultado muestra que se ha alcanzado la cota superior 
en el corolario anterior. 


Teorema 5.20. Toda matriz de transición tiene a 1 como eigenvalor. 


DEMOSTRACIÓN. Sea A una matriz de transición de n x n y sea u €R" 
el vector columna en donde cada coordenada es 1. Entonces, según el 
Teorema 5.18, A'u = u y por tanto u es un eigenvector de A’ que corres- 
ponde al eigenvalor 1. Pero como A y 4* tienen los mismos eigenvalores 
se tiene que 1 también es un eigenvalor de 4. MW 


Supóngase ahora que A es una matriz de transición para la que algún 
eigenvector que corresponde al eigenvalor 1 tiene únicamente coordenadas 
no negativas. Entonces algún múltiplo de este vector será un vector de 
probabilidad P, así como un eigenvector de A que corresponde al eigen- 
valor 1. Es interesante observar que si P es el vector de probabilidad 
inicial de una cadena de Markov que tenga a A como matriz de transi- 
ción, entonces la cadena de Markov es completamente estática, pues en 
esta situación A"P = P para cualquier entero positivo m y por lo tanto 
la probabilidad de estar en cada estado nunca cambia. Considérese, por 
ejemplo, el problema ciudad-suburbios con 


"- (1) 
¿ 
Teorema 5.21. Sea A €EMnxn(C) una matriz en la que todos los elementos son 


positivos y sea à un eigenvalor de A tal que A] = p(A). Entonces 
= p(A), y {u} es una base para Er, donde 
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DEMOSTRACIÓN. Como |A|= p(4) las tres desigualdades de la ecua- 
ción (5) en la demostración del Teorema 5.19 son realmente igualdades, 
esto es 


Y AxjXj 


j=1 


(b) È | Ay || x| =È | Au |b, 


jai 25 


(c) (A) = p(A), 


(a) 


E > | AÁkiXj l, 
j=1 


donde x, b y k son los mismos que se definieron en la demostración del 
Teorema 5.19. 

Veremos en el Ejercicio 15(b) de la Sección 7.1 que (a) se satisface 
si y sólo si todos los términos Ax;x;(j = 1, 2, ... , n) son múltiplos no 
negativos de algún número complejo no nulo z. Sin pérdida de generalidad, 
supondremos que |z|= 1. Luego existen números reales no negativos 
C, - .. , Cn tales que 


AkiXj = CjZ. (6) 
Evidentemente (b) se satisface si y sólo si para cada j tenemos que 


Akri = 00 |x; | = b. Como se supone que cada elemento de A es positivo, 
concluimos que (b) se satisface si y sólo si 


|x| =b para j=1,2,...,n. (7) 
Así tenemos que la ecuación (5), y por tanto el inciso (c) anterior, es 


válida para k = 1, 2,..., n. 
De la ecuación (6) vemos que 


X; bz l 


bz 1 


y entonces {u} es una base para En. 
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Claramente se ve que u es un eigenvector de A correspondiente al 
eigenvalor p(4) puesto que, de acuerdo con el inciso (c) anterior, 


l p2 Aij p (4) pCA) l 


l SA p (A) p(4) l 


Pero el párrafo anterior muestra que si A es cualquier valor de A tal que 
| à| = p(4), entonces u es un eigenvector al que corresponde A. Por lo 
tanto A= p(4). E 


Corolario 1. Sea A € Mnxn(C) una matriz en la cual cada elemento es positivo, 


y sea 4 un eigenvalor de A tal que |à | = v(A). Entonces A = v(A), y 
la dimensión de E, es 1. 


DEMOSTRACIÓN. Ejercicio. 


Corolario 2. Sea AEM,,,(C) una matriz de transición en la que cada elemento 


es positivo y sea à un eigenvalor de A distinto de 1. Entonces |A|< 1. 
Además, la dimensión del eigenespacio correspondiente al eigenvalor 1 
es 1. 


DEMOSTRACIÓN. Ejercicio. 


Nuestro siguiente resultado generaliza el corolario anterior para matri- 
ces regulares de transición y, por tanto, demuestra que las matrices regu- 
lares de transición satisfacen las dos primeras condiciones de los Teore- 
mas 5.16 y 5.17. 


Teorema 5.22. Sea A una matriz regular de transición. 


(a) Sià es un eigenvalor de A, entonces | à | < 1. 
(b) Si A es un eigenvalor de A tal que | à | = 1, entonces A es el nú- 
mero real 1 y dim(E,) = 1. 


En otras palabras, à = 1 es el único eigenvalor de A cuyo valor absoluto 
es 1 y dim(Ex) = 1. Todos los demás eigenvalores de A tienen valores 
absolutos menores que 1. 


DEMOSTRACIÓN. El inciso (a) ya fue demostrado como Corolario 2 del 
Teorema 5.19. 


Como A es regular, existe un entero positivo s tal que A* tiene única- 
mente elementos positivos. Como A es una matriz de transición y los 
elementos de A* son positivos, los elementos de 4** = 4*(4) son positivos. 
Sea A un eigenvalor de 4 cuyo valor absoluto es 1. Entonces A* y NY 
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son eigenvalores de A* y A**, respectivamente, y tienen un valor absoluto 
de 1, y de acuerdo con el Corolario 2 del Teorema 5.21, A* =A'"* = 1. 
Luego à = 1. Sean E, y E, los eigenespacios de A y de 4*, respectiva- 
mente, correspondientes al eigenvalor A = 1. Entonces E, € En pero F’ 
tiene dimensión 1 (Corolario 2 del Teorema 5.21). Por lo tanto E, = ES 
y dim(E,) = 1. B 


Corolario. Sea A una matriz regular de transición diagonalizable. Entonces exis- 
te lim A”. 
m>» 
El corolario anterior, que se obtiene directamente de los Teoremas 
5.22 y 5.17, no es el mejor resultado posible. De hecho, puede demostrarse 
que si A es una matriz regular de transición, entonces la multiplicidad 
de 1 como eigenvalor de A es 1. Entonces, de acuerdo con el Teorema 
5.12, se satisface la tercera condición del Teorema 5.16. Así, si Æ es 
una matriz regular de transición, existe lim 4”, sea A diagonalizable o 


mo Ñ 
no. Sin embargo, como ocurrió con el Teorema 5.16, el hecho de que 
la multiplicidad de 1 como eigenvalor de A sea 1 no puede demostrarse 
ahora. Sin embargo, enunciaremos este resultado aquí (dejando la demos- 
tración para el Ejercicio 20 de la Sección 6.2) y deduciremos más hechos 
sobre el lim A” cuando A es una matriz regular de transición. 


mos 


Teorema 5.23. Sea A una matriz regular de transición de n x n. Entonces 


(a) La multiplicidad de 1 como eigenvalor de A es 1. 
(b) El lim A” existe. 


mo > 


(c) L= lim A” es una matriz de transición. 


(d) AL=LA=L. 

(e) Las columnas de L son idénticas. De hecho, cada columna de 
L es igual al único vector de probabilidad v que es también un 
eigenvector que corresponde al eigenvalor 1 de A. 

(£) Para cualquier vector de probabilidad x, lim(A"x) = v. 


1: >% 


DEMOSTRACIÓN. 


(a) Véase el Ejercicio 20 de la Sección 6.2. 
(b) La demostración de que lim 4” existe se obtiene del inciso (a) 


y de los Teoremas 5.22 y 5.16. 

(c) Como A” es una matriz de transición de acuerdo con el coro- 
lario del Teorema 5.18, cada elemento de A” es no negativo (m = 1, 2, 
3, ...). Por tanto 


L;¡¡= lim (4”);;>0 para I<i j<n. 


mo» 
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Además, 


Š Lu = È [im (4) = lim | $ (43) |= tim (1) = 1 


i=l mo m>o m>ooo 
para 1<j<mn. 


Luego L es una matriz de transición. 

(d) De acuerdo con el Teorema 5.15, 

AL = A(lim 4”) = lim (44”) = lim A" = L. 
m>o mu m> 
De manera análoga LA = L. 

(e) Como AL= L, de acuerdo con el inciso (d), cada una de las 
columnas de L es un eigenvector de A correspondiente al eigenvalor 1. 
Además, de acuerdo con el inciso (c), cada columna de L es un vector de 
probabilidad. Entonces de acuerdo con el inciso (a) cada columna de L 
es igual al único vector de probabilidad v correspondiente al eigenvalor 
1 de A. 

(f) Sea x cualquier vector de probabilidad y hágase a y = Lx. Enton- 
ces y es un vector de probabilidad (corolario del Teorema 5.18), y 
según el inciso (d) Ay = ALx = Lx = y. Por lo tanto y es también un 
eigenvector que corresponde al eigenvalor 1 de A. Entonces, de acuerdo 
con el inciso (e), y =v. E 


Definición. El vector v del inciso (e) del teorema anterior se denomina vector 


de probabilidad fija (o vector estacionario) de la matriz regular de tran- 
sición A. 

Utilizaremos ahora el Teorema 5.23 para obtener información sobre 
los porcentajes eventuales en cada estado de una cadena de Markov que 
tiene una matriz regular de transición. 


Ejemplo 20. En una investigación realizada en la antigua Persia se obtu- 
vo como resultado que en un día en particular el 50% de los persas prefería 
una hogaza de pan, el 30% prefería una jarra de vino y el 20% restante 
prefería un momento de holgorio. Una investigación subsecuente realizada 
un mes después arrojó los datos siguientes: De los que prefirieron una 
hogaza de pan en la primera investigación, el 40% siguieron prefiriendo 
una hogaza de pan, el 10% ahora prefirieron una jarra de vino y el 50% 
prefirieron irse de parranda; de los que prefirieron una jarra de vino en 
la' primera investigación, el 20% prefirió ahora una hogaza de pan, el 
70% continuaron prefiriendo una jarra de vino y el 10% ahora prefirie- 
ron la parranda; de los que prefirieron el holgorio en la primera investi- 
gación, el 20% prefirió ahora una hogaza de pan, el 20% prefirió ahora 
una jarra de vino y el 60% continuó prefiriendo lo mismo. 

La situación descrita en el párrafo anterior es una cadena de Markov 
de tres estados en donde los estados son las tres posibles preferencias. Supo- 
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niendo que la tendencia anterior continúe, podemos predecir el porcentaje 
de persas en cada uno de los estados para cada mes a partir de la 
investigación original. Haciendo que los estados uno, dos y tres sean 
respectivamente las preferencias por el pan, el vino y el holgorio, vemos 
que el vector de probabilidad que da la probabilidad inicial de estar en 
cada uno de los estados es 

0.50 

P =|0.30 |» 
0.20 


y la matriz de transición será 


0.40 0.20 0.20 
A =|0.10 0.70 0.20]- 
0.50 0.10 0.60 
Las probabilidades de estar en cada uno de los estados m meses después 


de la encuesta original son las coordenadas del vector 4”P. El lector po- 
drá verificar que 


0.30 0.26 0.252 
AP=1|0.30l,  ÆP = A(4P) =|0.32|),  ÆP = A(4*P) = | 0.334], 
0.40 0.42 0.414 
y 
0.2504 
A*P = A(A?*P) = | 0.3418 |. 
0.4078 


Nótese la convergencia progresiva de 4”P. 

Como A es regular, la predicción a largo plazo relativa a las prefe- 
rencias de los persas puede obtenerse calculando el vector de probabi- 
lidad fija para A. Este vector es el vector de probabilidad único v tal que 
(A — Dv=0. Si 

vı 
v=|0)]|> 
V3 
vemos que la ecuación matricial (A — I)v= 0 arroja el siguiente sistema 
de ecuaciones lineales: 


—0.60v, + 0.20, + 0.20, = 0 
0.10v, a 0.30v, + 0.20v, = 0 
0.50v, + 0.10v, — 0.40v, = 0. 
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Se puede demostrar fácilmente que 
5 
7 
8 


es una base para el espacio de soluciones de este sistema. Por lo tanto el 
único vector de probabilidad fija para A es 


5 
5+7+8 0.25 
7 N 
5374811035) 
8 0.40 
S+7+8 


Entonces a largo plazo, el 25% de los persas preferirá una hogaza de 
pan, el 35% preferirá una jarra de vino y el 40% preferirá un rato de 
holgorio. 

Nótese que si 


5 0 3 
Q=|7 ı ıb 
entonces 8 —1 —4 
| 0 0 
O AQ=|0 05 0 
0 0 02 
Y así 
l 0 01” 1 0 0 
lim 4” =Q|lim|0 05 0 “1=Q|0 O OJO”! 
S a o o0 00 0 
0.25 0.25 0.25 
= | 0.35 0.35 0.35]. 


0.40 0.40 0.40 


Ejemplo 21. Los granjeros de Lamron siembran un cultivo por año —ya 
sea maíz, soya o trigo. Como ellos creen en la necesidad de hacer una 
rotación de cultivos, estos agricultores no siembran el mismo cultivo en 
años subsecuentes. De hecho, de la superficie total de cultivo en la cual 
se siembra un determinado cultivo, exactamente la mitad será sembrada 
con los otros dos cultivos durante el año siguiente. Este año, 300 hectáreas 
fueron sembradas de maíz, 200 hectáreas fueron sembradas de soya y 100 
hectáreas de trigo. 
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La situación descrita en el párrafo anterior es otra cadena de Markov 
de tres estados en la que los tres estados corresponden respectivamente a 
las áreas sembradas de maíz, soya y trigo. Sin embargo, en este problema 
se dio la cantidad de tierra destinada a cada cultivo en vez de los porcen- 
tajes de la superficie total de cultivo (600 hectáreas). Transformando estas 
cantidades en fracciones de la superficie total, vemos que la matriz de 
transición A y el vector de probabilidad inicial de la cadena de Markov 
son 


300 
044 600 y 
a=l4 04] y P=/%p0|-|5 
330 100 4 
600 


Entonces la fracción de la superficie total de cultivo destinada a cada 
uno de los cultivos en m años estará dada por las coordenadas de A”P 
y las proporciones eventuales de la superficie total de cultivo destinadas 
para cada cultivo son las coordenadas de lim A”P. Así, las cantidades 


mas 
eventuales de tierra destinada a cada cultivo se obtienen al multiplicar este 
límite por la superficie total de cultivo; esto es, las cantidades de tierra 
para ser utilizadas eventualmente en cada cultivo son las coordenadas de 
600(lim A”P). 


m>» 


Como A es una matriz regular de transición, el Teorema 5.23 demues- 
tra que lim 4” es una matriz L en la cual cada columna es igual al 


m>?» 


único vector de probabilidad fija para Æ. Puede verse fácilmente que el 
vector de probabilidad fija para A es 


3 
1 
3 
1 
y 
Entonces 
1 1 1 
3373 
L=(y 4 4) 
133 
y así 200' 
600(lim 4” P) = 600LP = 200 |. 


200 


Luego, a largo plazo esperamos que 200 hectáreas sean sembradas cada 
año con cada cultivo. (Para un cálculo directo de 600(lim A”P), véase 
el Ejercicio 14.) mS 


290 


Diagonalización 


En esta sección nos hemos concentrado fundamentalmente en la teoría 
de las matrices regulares de transición. Existe otra clase interesante de 
matrices de transición que puede representarse en la forma 


I B 
(o c) 

donde 7 es una matriz identidad y O es una matriz nula. (Tales matrices 
de transición no son regulares puesto que el bloque inferior izquierdo con- 
tinúa siendo O para cualquier potencia de la matriz.) Los estados corres- 
pondientes a la submatriz identidad se denominan estados absorbentes 
porque uno de tales estados no puede ser abandonado una vez que se ha 
entrado en él. Una cadena de Markov se llama cadena de Markov absor- 
bente si es posible pasar de un estado cualquiera a un estado absorbente 
en un número finito de etapas. 

Obsérvese que la cadena de Markov que describió las características 
de los registros en un plantel de bachillerato es una cadena de Markov 
absorbente con los estados 1 y 4 como sus estados absorbentes. Los lec- 
tores interesados en conocer más sobre las cadenas de Markov absorbentes 
deben consultar Introduction to Finite Mathematics (tercera edición), 
por J. Kemeny, J. Snell y G. Thompson, Prentice-Hall, Inc., 1974 o bien 
Discrete Mathematical Models por Fred S. Roberts, Prentice-Hall, Inc., 
1976. 


Una aplicación 


En especies que se reproducen sexualmente, las características de una pro- 
genie con respecto a una característica genética en particular están deter- 
minadas por un par de genes, uno heredado de cada padre. Los genes 
para una característica determinada son de dos tipos, G y g. El gen G 
representa la característica dominante y g representa la característica 
recesiva. La descendencia con genotipos GG o Gg muestran las caracte- 
rísticas dominantes mientras que la progenie con características gg tienen 
características recesivas. Por ejemplo, en los humanos, los ojos cafés son 
una característica dominante y los ojos azules son la característica recesiva 
correspondiente; por ello, cualquier descendencia con genotipos GG o 
Gg tendrán los ojos cafés mientras aquellos cuyo tipo sea gg tendrán los 
ojos azules. 

Consideremos la probabilidad de tener descendencia de cada genotipo 
para un progenitor macho de genotipo Gg. (Supondremos que la población 
bajo consideración es grande, que el cruzamiento es aleatorio con res- 
pecto al genotipo y que la distribución de cada genotipo dentro de la 
población es independiente del sexo y de la esperanza de vida.) 
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Sea 
P 
P=|q 
: 


la proporción de la población adulta con genotipos GG, Gg y gg, respec- 
tivamente, al principio del experimento. Este experimento describe una 
cadena de Markov de tres estados con una matriz de transición. 


Genotipo del Progenitor 


GG Gg gg 
Genotipo GG 1 4 0 
del Gg 4 4 14]= 
Descendiente gg 0.4 4 


Se puede verificar fácilmente que B? contiene sólo elementos positivos; 
luego, B es regular. Entonces, al permitir que sólo los machos del genotipo 
Gg se reproduzcan, la proporción de la descendencia en la población que 
tiene un cierto genotipo se estabilizará en el vector de probabilidad fija 
para B, que es 


Ahora supóngase que se deben realizar experimentos semejantes con 
machos de genotipos GG y gg. Estos experimentos son cadenas de Markov 
de tres estados con matrices de transición 


1.40 0.0.0 
A=|0 4 1] y cC=|1 4 0)» 
0.00 0 4 1 


respectivamente. Con el objeto de considerar el caso donde todos los 
genotipos machos pueden reproducirse, debemos formar la matriz de tran- 
sición M = pA + qB + rC, que es una combinación lineal de 4, B y C 
ponderada por la proporción de machos de cada genotipo. Entonces 


pri 4p+44 0 
M=|ltq+r ip+34q+4r p+3q]- 
0 44 +41 19 +r 


Para simplificar la notación, sea a = p + %q y b = 4q + r. (Los números 
a y b representan respectivamente las proporciones de los genes G y 
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g en la población.) Entonces 


M = 


O — A 
N= 
ra Oo 


donde a+ b=p+qw+r=1. 
Sean p', q' y r' la proporción de la descendencia de primera genera- 
ción que tiene respectivamente genotipos GG, Gg y gg. Entonces 


p' ap + %aq a? 
q |= MP = bp + 4q + ar = | 2ab |- 
r’ 4bq + br b? 


Con objeto de considerar los efectos de cruzamientos no controlados 
entre la progenie de primera generación, se debe determinar una nueva 
matriz de transición M basada en la distribución de los genotipos de pri- 
mera generación. Como antes, encontramos que 


p +4 dp" +14 0 a la” 0 
M= lg + r 1p' + lg + Jr" p' + lg" =| p } a'l» 
0 dq + 4r’ 4q' + r 0 4b' b' 


donde a' = p' + 4g' y b’ = 4q' + r’. Pero 
a =a + 3(Qab) =ala+ b)=a 


b’ = 1(2ab) + b? = b(a + b) = b. 


Entonces M = M, y así la distribución de una progenie de segunda gene- 
ración entre los tres genotipos es 


a? + a?b aa + b) a? 
M(MP) = M?P = | a?b + ab + ab? | = | abla + 1 + b) | = | 2ab 
ab? + b? b?(a + b) b? 


> 


que es la misma que la descendencia de primera generación. En otras pala- 
bras, MP es el vector de probabilidad fija para M, y el equilibrio genético 
se alcanza en la población después de sólo una generación. (Este resulta- 
do se llama Ley de Hardy-Weinberg.) Nótese que en el caso especial 
importante donde a = b (o de manera equivalente, donde p = r), la dis- 
tribución en el equilibrio es 


a? a? 4 
MP = | 2ab | = | 2a? | = 4 
b? a? ł4 
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EJERCICIOS 
1. Decir si las siguientes afirmaciones son verdaderas o falsas. 
(a) Si AEMpxn(C) y lim 4” = L, entonces, para cualquier matriz inver- 
tible Q €Mnxn(C), lim QA”0” = QLOQ”. 
(b) Si 2 es un eigenvalor de A € Mnxn(C), entonces el lim A” no existe. 
(c) Un vector mR 
Xı 
e R’ 
Xn 
tal que xı +... + Xa = 1 es un vector de probabilidad. 
(d) La suma de los elementos de cada renglón de una matriz de transi- 
ción es 1. 
(e) El producto de una matriz de transición por un vector de probabili- 
dad es un vector de probabilidad. 
(£) La matriz 
1 0 —1 
O 1 1 
—1 1 0 
no tiene a 3 por eigenvalor. 
(g) Toda matriz de transición tiene a 1 por eigenvalor. 
(h) Ninguna matriz de transición puede tener a —1 por eigenvalor. 
(i) Si A es una matriz de transición, entonces lim A” existe. 
(j) Si A es una matriz regular de transición, entonces el lim A” existe 


2. 


y tiene rango 1. IER 


Determinar si el lim A” existe o no para las siguientes matrices A. Si el 


mo» 


límite existe, calcularlo. 


(2) 


(a) le a (b) (c) (e a 
0.7 0.1 0.75 0 0.6 0.3 

(d) / 2 1 (e) /—2 -i (£) /—0.5 0.5 
c 0) 4 y 0.9 Po 
—1.8 0 —1.4 (h) /-25 45 75 
—5.6 1 —28 A a 


2.8 0 2.4 —1.5 4.5 6.5 
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O Joker (de Les 
E A 
por a ass: 

1) ¡26,1 —28 4i 
el G 


—13 —5 ,, 35 10 

o. A 
Demostrar que si 4,, Az, Az, ... es una sucesión de matrices de n x p 
con elementos complejos tal que lim Am = L, entonces lim 4! = Lt 


Demostrar que si A €Maxn(C) es diagonalizable y L = lim A” existe, en- 
tonces L = I, O bien rango(L) <n. ue 


Encontrar las matrices A y B de 2 x 2 que tengan como elementos a 
números reales tales que lim 4”, lim B” y lim (AB)" existen pero 


lim (4B)” 2 (lim A”) (lim B”). 


m > 0 m>o m>o 


230 m>o 


Una unidad de traumatología de un hospital ha determinado que al momen- 
to de llegar al hospital el 30% de sus pacientes es ambulatorio y el 70% 
debe guardar cama. Un mes después de su llegada, el 60% de los pacientes 
ambulatorios se ha recuperado, 20% permanece ambulatorio y 20% ahora 
debe guardar cama. Después del mismo lapso, 10% de los pacientes enca- 
mados se ha recuperado, 20% ahora es ambulatorio, 50% permanece en- 
camado y el 20% ha muerto. Determinar el porcentaje de pacientes que se 
recuperaron, son ambulatorios, están encamados y han muerto un mes des- 
pués de su llegada. También determinar el porcentaje eventual de pacientes 
de cada tipo. 


Un jugador principia un juego de azar colocando una ficha en el casillero 2 
(marcada salida). (Véase Fig. 5.4.) Se lanza un dado y la ficha se mueve 
un cuadro a la izquierda si se obtiene 1 o 2 y un cuadro a la derecha si se 
obtiene 3, 4, 5 o 6. Este proceso continúa hasta que la ficha llega al cua- 
dro 1 (en cuyo caso el jugador gana el juego) o en el cuadro 4 (en cuyo 
caso el jugador pierde el juego). ¿Cuál es la probabilidad de ganar este 


juego? 
Gana | Salida Pierde 
1 2 3 4 


figura 5.4 


10. 
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¿Cuáles de las matrices siguientes son matrices regulares de transición? 


(a) /0.2 0.3 0.5 (b) /0.5 O 1 (c) /05 0 0 
0.3 0.2 0.5 05 0 0 0.5 0 1 
05 05 0 010 010 
(d) /0.5 O 1 (e) /4 0 0 (5 /1 0 0 
0.5 1 0 4150 0 0.7 0.2 
0.00 4 0 1 0 0.3 0.8 
(2) 0400 h 4400 
4 000 4} 400 
4410 1410 
4401 } 401 
Calcular lim A”, si existe, en cada una de las matrices A del Ejerci- 
cio 8. 


Cada una de las matrices siguientes es una matriz regular de transición 
para una cadena de Markov de 3 estados. En todos los casos el vector de 
probabilidad inicial es 


0.3 
P=|0.3]- 
0.4 


Para cada matriz de transición, calcular la proporción de los objetos en 
cada estado determinando el vector de probabilidad fija. 


(a) /0.6 0.1 0.1 (b) /0.8 0.1 0.2 (c) /0.9 0.1 0.1 


0.1 0.9 0.2 0.1 0.8 0.2 0.1 0.6 0.1 
0.3 0 0.7 0.1 0.1 0.6 0 0.3 0.8 
(d) /0.4 0.2.0.2 (e) /0.5 0.3 0.27 (© /06 0 0.4 
0.1 0.7 0.2 0.2 0.570.3 0.2 0.8 0.2 
0.5 0.1 0.6 0.3 0.2 0.5 0.2 0.2 0.4 


En 1940 una investigación municipal del uso de la tierra mostró que el 
10% de la tierra del municipio era urbana, el 50% no estaba utilizada y 
el 40% estaba destinada a usos agrícolas. Cinco años después una investi- 
gación de actualización reveló que el 70% de la superficie urbana había 
permanecido urbana, 10% se había convertido en no utilizada y el 209% 
se había transformado en superficie agrícola. De la misma manera, 20% de 
la superficie no utilizada se había convertido en urbana, 60% había per- 
manecido no utilizada y 20% se había convertido en superficie agrícola. 
Finalmente, la investigación de 1945 mostró que el 20% de la superficie 
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agrícola se había convertido en no utilizada, mientras que el 80% perma- 
neció agrícola. Suponiendo que las tendencias indicadas por la investigación 
de 1945 continuaran, calcular los porcentajes de las superficies urbanas, no 
utilizadas y agrícolas en el municipio en 1950 y los porcentajes eventuales 
correspondientes. 


Se coloca un protector de pañal en cada pañal utilizado por un bebé. Si 
después de un cambio de pañal el protector está sucio, entonces es dese- 
chado; de lo contrario, el protector se lava con los pañales y es reutilizado, 
a menos que haya sido usado ya tres veces, en cuyo caso se desecha (aun 
cuando nunca se haya ensuciado). La probabilidad de que un bebé ensucie 
un protector de pañales es de un tercio. Si al principio sólo se tienen pañales 
nuevos, en un tiempo cualquiera ¿qué proporción de los protectores de 
pañales serán nuevos, con una utilización y con dos utilizaciones? 


En 1965 la industria automotriz determinó que el 40% de los americanos 
poseedores de autos conducía autos grandes, 20% conducía autos de tama- 
ño mediano y el 40% conducía autos pequeños. Una segunda investigación 
en 1975 mostró que el 70% de los dueños de autos grandes de 1965 aún 
poseía autos grandes en 1975, pero el 30% había cambiado a autos de 
tamaño mediano. De aquellos que poseían automóviles de tamaño mediano 
en 1965, 10% había cambiado a autos grandes, el 70% seguía guiando 
autos medianos y el 20% había cambiado a autos pequeños en 1975. 
Finalmente, de los dueños de autos pequeños de 1965, el 10% poseía autos 
medianos y el 90% poseía autos pequeños en 1975. Suponiendo que esta 
tendencia continúe, determinar el porcentaje de americanos que poseerán 
autos de cada uno de los tamaños en 1985 y los porcentajes eventuales 
correspondientes. 


Demostrar que si 4 es tal como en el Ejemplo 21, entonces 


Fm Fm+1 Fm+1 
A” = mti Fm Fmi P 
Pm+1 Prat Fm 
donde 
1 (—-1)” 
Im = 3 [i + E . 
Deducir que 
200 + 2 (100) 
300 
600(4”P) = A”| 200 | = 200 
100 


200 + EY" Dr (100) 


15. 


16. 


17. 


Subespacios invariantes 297 
Demostrar el Teorema 5.18 y su corolario. 
Demostrar los dos corolarios del Teorema 5.21. 


Demostrar el corolario del Teorema 5.22. 


Definición. Si AEM,,.(C), se define e^ = lim Bm, donde 


18. 


19. 


20. 


21. 


22. 


5.4* 


mo 


O p 
2! m! 


Luego, e* es la suma de la serie infinita 


2 3 
Pra 


21 a a 


y Bm es la suma parcial m-ésima de esta serie. Nótese la analogía con la 
serie de potencias 
a? a? 


E as 


e=lt+tat z 37 


válida para todo número complejo a. 


Calcular e” y el, donde O e I son respectivamente las matrices nula e 
identidad de n x n. 


Supóngase que P'AP es una matriz diagonal D. Demostrar que et = P-*e?P. 


Sea A € Mnxn(C) diagonalizable. Utilizar el resultado del Ejercicio 19 para 
demostrar que e* existe. (El Ejercicio 21 de la Sección 6.2 demostrará 
que e” existe para toda B € Mnxn(C).) 


Encontrar A, BE€EM.,.(R) tal que ete! 4 e^. 

Demostrar que una función diferenciable X: R — R" es una solución al 
sistema de ecuaciones diferenciales definido en el Ejercicio 17 de la 
Sección 5.2, si y sólo si X es de la forma X(t) = e'*v para alguna v ER", 
donde A es como se define en dicho ejercicio. 


SUBESPACIOS INVARIANTES 


En la Sección 5.1 observamos que si x es un eigenvector de un operador 
lineal T, entonces T mapea al subespacio generado por {x} en sí mismo. 


* Esta sección no es necesaria en el Capítulo 7. 
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Los subespacios que se mapean en sí mismos son de una gran importancia 
en el estudio de los operadores lineales. 


Definición. Sea T un operador lineal en un espacio vectorial V. Un subespacio 
W de V se llama subespacio T-invariante de V si T(W) C W, esto es 
T(x) EW para toda x €W. 


Para cualquier operador lineal T en V los subespacios (0) y V son T-in- 
variantes. Estos dos subespacios se llaman subespacios T-invariantes impro- 
pios; todos los demás se llaman subespacios T-invariantes propios. 

Es deseable descomponer un espacio vectorial dimensionalmente finito 
V en una suma directa de tantos espacios T-invariantes propios como sea 
posible, puesto que el comportamiento de T puede ser inferido a través de 
su comportamiento en cada uno de los sumandos directos. Si T es diago- 
nalizable, entonces V puede descomponerse en una suma directa de sub- 
espacios T-invariantes unidimensionales, que son los subespacios generados 
por los vectores de la base formada por los eigenvectores de T. (Véase 
Ejercicio 7.) En general no existe tal descomposición. En el Capítulo 6 
consideraremos algunas maneras para descomponer a V en una suma 
directa de subespacios T-invariantes cuando T no sea diagonalizable. En 
esta sección estudiaremos dos propiedades básicas de las sumas directas 
de subespacios T-invariantes. 

Para un operador lineal T en un espacio vectorial V, la restricción de 
T a un subespacio T-invariante W es un mapeo de W en sí mismo. (Véase 
Apéndice B.) Es fácil demostrar que este mapeo Tw es un operador lineal 
en W. (Véase Ejercicio 4.) Nuestro primer resultado relaciona el polinomio 
característico de Tw con el de T. 


Teorema 5.24. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sea W un subespacio T-invariante de V. Entonces el 
polinomio característico de Tw divide al polinomio característico de T. 


DEMOSTRACIÓN. Extiéndase una base y = [x,,..., xx) para W a una 
base B = [X1, ... , Xk... , Xn} para V. Sea A = [Tlg y B,= [Tw]s. En- 
tonces por el Ejercicio 5 
— {Bı B: 
A e a) 


donde O es una matriz nula de (n — k) x k. Si f(t) es el polinomio ca- 
racterístico de T y g(t) es el polinomio característico de Tw, entonces, 
de acuerdo con el Ejercicio 9 de la Sección 4.3, 


ToN — e B, a tly B, Po E e 
F) = det(A — th) = der ( A TE A 2(0) -det(Ba — tha). 


Y tenemos que g(t) divide a f(1). MW 
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Ejemplo 22. Sea T: R*—>R* definida mediante 
T(a,b,c,d) = (a+ b+2c=d,b+d,2c-— d, c+ d), 
y sea W = ([(t, s, 0,0): t,s € R). Obsérvese que W es un subespacio T-in- 
variante de R*, ya que 
T(a, b, 0, 0) = (a + b, b, 0, 0) EW. 


Sea y = [e,, €} y nótese que y es una base para W. Extiéndase y a la 


base estándar 8 para R*. Entonces 
—1 


1 
—1 
1 


l 
1 1 0 
B =M= h |) y 4=M=lo 


OO =. m 
= V O N 


0 


de acuerdo con la notación del Teorema 5.24. Luego, si f(t) es el poli- 
nomio característico de T y g(t) es el polinomio característico de Tw, 


entonces 
l—¿ 1 2 —1 
l—t 0 1 
t) = det(A — tI,) = det 
PAO) et( 4) e 0 0 24 —] 
0 0 1 l-—1 


(1 —t 1 2 — —1 2=t —1 
= dei( al ' ) = £(0)-der| ) 
0 l—t 1 l—t 1 l—t 


El siguiente teorema muestra que si V es la suma directa de subespacios 
T-invariantes, entonces el polinomio característico de T está completamente 
determinado por los polinomios característicos de las restricciones de T 
para cada uno de los sumandos directos. 


Teorema 5.25. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y supóngase que V=W,OQD ... BO Wi, donde W; es un 
subespacio T-invariante de V para toda i(1 <i < k). Si f(t) es el polino- 
mio característico de T y f,(t) es el polinomio característico de Tw,(1 < 
< i < k), entonces 


f(t) = f(t) f(t)... f(t). 


DEMOSTRACIÓN. La demostración se hará por inducción sobre k. Supón- 
gase primeramente que k = 2. Sea £, una base para W,, $, una base para 
W. y B = Bı U fz. Entonces £ es una base para V. Sean A = [Tlg, B, = 
= [Tw.lg, y B2 = [Tw.]g,. Se ve fácilmente por el Ejercicio 5 que 


_/[B, O 
io a 
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donde O y O” son matrices nulas. Por lo tanto, por el Ejercicio 9 de la 
Sección 4.3, 


f(t) = det(A — tI) = det(B, — tI) : det(B, — tI) = fiO ` f(t) 


lo que demuestra el resultado si k = 2. 

Ahora supóngase que el teorema es cierto para k — 1 sumandos, don- 
de k — 1 es algún entero mayor o igual a 1. Supóngase que V es una suma 
directa de k sumandos, 


V=Ww 0w: @... 0 W, 
y defínase W = W, + W, + ... + Wk. Puede verificarse fácilmente que 
V=WQW;. Así, por el caso para k = 2, f(t) = g(t): f(t), donde 
g(t) es el polinomio característico de Tw. Claramente sẹ tiene que W = 
W,OWO ---OWo-: Por tanto por la hipótesis de inducción tene- 
mos que g(1) = f,(1) *f2(1) >... fra (t). Entonces f(t) = g(t): f(D) = 
=f f.. h Y 


Si T es un operador lineal diagonalizable en un espacio vectorial n-di- 
mensional V para el cual los eigenvalores distintos son à, Az, ...3 Ax, 
entonces por el Teorema 5.14 V = E, DE,, O --* @ EL. Se ve claramen- 
te (véase Ejercicio 3) que cada Ea, es T-invariante y la restricción de T 
a E,, tiene como polinomio característico a (A; — t)", donde m; es la 
multiplicidad de A;. Por tanto, dentro de este contexto, el teorema anterior 
arroja la conclusión evidente de que el polinomio característico de T es 
(Ai — DA — DW... (Àx ga = (1 — AJA AM. 
ois (t — àk)". 

La siguiente aplicación del Teorema 5.25 sugiere otro resultado sobre 
las sumas directas. 


Ejemplo 23. Sea T: R*—R* definida mediante 

T(a, b, c, d) = (2a — b,a + b,c—d,c+d), 
y sean W, = { (s, £, 0, 0): s, ER) y W: = { (0, 0, s, t): s, ER}. Nótese 
que W, y W: son ambos T-invariantes y que Rt = W, @ Wz. Sean 8, = ([e,, 
e»), Bo = [es, e) y B5 [e,, €, €, es). Entonces ff, es una base para 
W,, £z es una base para W, y f es una base para Rt. Si B, = [Tw]s,, B: = 
= [Tw.ls.. y 4 = [T]g, entonces 


y rel 7È El 
B =(; J B.=(; 1) 


Subespacios invariantes 301 

Además, si f(z) es el polinomio característico de T, f,(1) es el polinomio 

característico de Tw, y f.(1) el polinomio característico de Tw,, entonces 
f(t) = det(A — tI) = det(B, — tI) : det(B, — tI) = f(D f(d). 


La matriz A del ejemplo anterior puede obtenerse uniendo las matrices 
B, y B, de la manera explicada en la definición siguiente. 


Definición. Sean B, y B, matrices cuadradas (no necesariamente del mismo ta- 


maño) que tengan elementos del mismo campo. Si B, es una matriz de 
mxm y B, es una matriz de n x n, entonces la suma directa de B, y 
B,, representada por B, Q B., es la matriz A de (m + n) x (m + n) tal 
que 


(Ba): para 1<1i,j<m 


Aij = (B2) a-m), (j-m) para m +1 < 1, j < n+m 
0 en cualquier otro caso. 
Si B,, B», ... , B, son matrices cuadradas con elementos del mismo cam- 
po, entonces definimos la suma directa de B,, B., ... , By recursivamente 


mediante B, Q B: @® ...OB.= (B,OB.O ... OB.) Q Br Si A = 
=B,0B.0 ... OB,, escribiremos a menudo 


B O.. 0 
OB = O 
A = . . . 
O O... B 


Ejemplo 24. Sean 


Entonces 
120000 
110000 
003000 
P Bo D Be y y 
000123 
00.01 11 


El resultado final de esta sección relaciona las sumas directas de matri- 
ces con las sumas directas de subespacios invariantes, y enuncia el caso 
general de la relación entre las matrices A, B, y B. del Ejemplo 23. 
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Teorema 5.26. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sean W,, Wa, ... , Wi subespacios T-invariantes de V 
tales que V =W, W,¿O OW. Para cada i, sea B, una base para 
W y B8=B.UB.U... U Bu. Si A =[Tlg y A; = [Tw,]g, para i= 1, 
2,..., K, entonces A = AL QA Q... Ar 


DEMOSTRACIÓN. Ejercicio. 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Existen operadores lineales T que no tienen subespacios T-invariantes. 

(b) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito V y W es un subespacio T-invariante de V, entonces el polino- 
mio característico de Tw divide al polinomio característico de T. 

(c) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito V y si V es una suma directa de subespacios T-invariantes, en- 
tonces existe una base 8 para V tal que [T]g es una suma directa de 
matrices. 


2. Para cada uno de los siguientes operadores lineales T, determinar si el sub- 
espacio dado W es un subespacio T-invariante de V. 


(a) Sea T el operador en V = P¿(R) definido mediante T(f) = f', la deri- 
vada de f, y W = P,(R). 

(b) Sea T el operador en V = P(R) definido mediante T(f(x)) = xf(x) 
y W= PA(R). 

(c) Sea T el operador en V = R? definido mediante 


T(a,, a2, 43) = (a, + a, + a, a, + az + a, @ ta + a) 
y 
W=((11 0: ER}. 


(d) Sea, T el operador en el espacio vectorial V de funciones continuas de 
valor real en [0, 1] definido mediante 


O =| fever y  W=(fEV: f(t) =at+b para al- 
gunas a, bER y toda 0<1<1). 


3. Sea T un operador lineal en un espacio vectorial dimensionalmente fini- 
to V. 


(a) Demostrar que {0} y V son subespacios T-invariantes de V. 
(b) Demostrar que N(T) y R(T) son subespacios T-invariantes de V. 


4. 


7.* 


10. 
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(c) Demostrar que si A es un eigenvalor de T, entonces E, es un subespa- 
cio T-invariante de V y la restricción de T a E, es Al. 

(d) Si W,, Wo, ..., Wy son subespacios T-invariantes de V, demostrar 
que 


k k 
2 W, y N W, 
son subespacios T-invariantes de V. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito 
V y sea W un subespacio T-invariante de V. 


(a) Demostrar que Tw es un operador lineal en W. 

(b) Demostrar que si A es un eigenvalor de Tw entonces A es un eigen- 
valor de T. 

(c) Demostrar que si x es un eigenvector de Tw entonces x es un eigen- 
vector de T. 


Verificar que en la demostración del Teorema 5.24 


_/B, B; 
a=(0 p,) 


y que en la demostración del Teorema 5.25 


_/B O 
4=(0 El 


Demostrar el Teorema 5.26. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demostrar que T es diagonalizable si y sólo si V es una suma directa de 
subespacios T-invariantes unidimensionales. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
y sean W,, Wa, ... , Wy subespacios T-invariantes propios de V tales que 
V=W, SW, O --: O W,. Demostrar que det(T) = det(Tw,)-det(Tw,)- +- 


det(Tw.)- 
Sea T un operador lineal en un espacio vectorial dimensionalmente finito V, 
y supóngase que W,, Wz, ... , Wx son subespacios T-invariantes de V tales 


que VW=W,GQW,0 --:SW,. Demostrar que si Tw, es diagonalizable 
para cada i, entonces T es diagonalizable. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 


(a) Demostrar que si el polinomio característico de T se descompone como 
un producto de factores de grado 1, lo mismo ocurre con el polinomio 
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11. 


12. 


13.* 


(b) 


(c) 


(d) 


(a) 


(b) 
(a) 


(b) 
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característico de la restricción de T a cualquier subespacio T-inva- 
riante de V. 

Deducir que si el polinomio característico de T se descompone en 
un producto de factores de grado 1, entonces cualquier subespacio T- 
invariante no nulo de V contiene un eigenvector de T. 

Sea W cualquier subespacio T-invariante de V. Demostrar que si A 
es un eigenvalor de Tw entonces el eigenespacio de Tw correspon- 
diente a A es Er N W, donde E, es el eigenespacio de T correspondien- 
tea a. 

Sea W cualquier subespacio T-invariante de V. Demostrar que si T 
es diagonalizable, también lo es Tw. Sugerencia: Utilizar los incisos 
(a) y (c) y el Teorema 5.14. 


Demostrar un recíproco del Ejercicio 19(a) de la Sección 5.2: Si T 
y U son operadores lineales diagonalizables en un espacio vectorial 
dimensionalmente finito tales que UT = TU, entonces T y U son 
simultáneamente diagonalizables. Sugerencia: Sean ài, Ao, ..., Ax 
los distintos eigenvalores de T y sean Er, (è = 1, 2,..., k) los co- 
rrespondientes eigenespacios de T. Demuéstrese que cada E,, es U- 
invariante y utilícese el Ejercicio 10(d) para obtener una base para 
Er, formada por eigenvectores de U. 

Enunciar y demostrar la versión matricial del inciso (a). 


El resultado del Ejercicio 11(a) puede ser generalizado de la mane- 
ra siguiente: Sea V un espacio vectorial dimensionalmente finito. 
Se dice que una colección € de operadores lineales diagonalizables 
en V es simultáneamente diagonalizable si existe una f para V tal 
que [T] es una matriz diagonal para cada TEC. 

Demostrar que una colección € de operadores lineales diagonali- 
zables en un espacio vectorial dimensionalmente finito V es simultá- 
neamente diagonalizable si y sólo si UT = TU para toda T, UEC. 
Sugerencia: En el caso de que UT = TU para toda T, U € œ, esta- 
blézcase primero el resultado cuando cada operador en € tenga' única- 
mente un eigenvalor. Luego establézcase el resultado general mediante 
inducción sobre dim(V) utilizando el hecho de que V puede expresarse 
como la suma directa de los eigenespacios para algún operador en €. 


Enunciar y demostrar la versión matricial del inciso (a). 


Los Ejercicios 13 y 14 requieren que el lector esté familiarizado con el 
Ejercicio 29 de la Sección 1.3. 


Sea T un operador lineal en V y sea W un subespacio T-invariante de V. 
Defínase 


T: VW-—>V/W por T(v + W =T(0) + W. 


(a) 


(b) 
(c) 


(d) 


14. (a) 


(b) 
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Demostrar que T está bien definido; esto es, demostrar que T(v + W) 
es independiente de la selección de v en el coconjunto de v + W. 
Demostrar que T es un operador lineal en V/W. 

Defínase 


n: V>V/W por nív) = v + W. 
Demostrar que y es una transformación lineal con espacio nulo W 
y rango V/W. 


Demostrar que el diagrama de la Fig. 5.5 es conmutativo; esto es 
nT = Tr. 


NN 


n n 


V/W > V [W 


figura 5.5 


Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V, y sea W un subespacio T-invariante propio de V. Sean f(t), 
g(t) y h(t) los polinomios característicos de T, Tw y T (tal como 
se definió en el Ejercicio 13), respectivamente. Demostrar que f(t) = 
= g(1)h(t). Sugerencia: Extender una base y = {xX ..., Xx} para 
W a una base B = {X ... , Xi --» > An) para V. Mostrar que [T]g 


es de la forma 
B, B, 
O B,) 


que B= {xr + W,..., Xn +W}, es una base para V/W, y que 
[Tlg — B.. 

Utilizar el Ejercicio 13 para demostrar que si T es diagonalizable, 
también lo será T. 


5.5* EL TEOREMA DE CAYLEY HAMILTON 


En la Sección 5.4 mencionamos que si T es un operador lineal en un espacio 
vectorial dimensionalmente finito V, entonces es deseable descomponer a V 
en una suma directa de tantos subespacios T-invariantes como sea posible. 
Cuando el polinomio característico de T se descompone en un producto 
de factores de grado 1, demostraremos en la Sección 6.1 que V puede 


El material de esta sección es necesario para las Secciones 5.6 y 6.3, pero 


no para las Secciones 6.1 y 6.2. 
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descomponerse siempre en una suma directa de los “eigenespacios genera- 
lizados” de T. De hecho, cuando T es diagonalizable, ésta es precisamente 
la descomposición dada en el Teorema 5.14. Sin embargo, si el polinomio 
característico de T no se descompone en un producto de factores de gra- 
do 1, entonces T puede incluso no tener eigenvalores. En este caso no 
podemos esperar descomponer a V en una suma directa como antes. No 
obstante, una descomposición de V en subespacios T-invariantes es aún 
posible. En esta sección definiremos el tipo especial de subespacios T-inva- 
riantes necesarios para esta descomposición y los emplearemos para demos- 
trar uno de los más famosos teoremas del álgebra lineal, el teorema de 
Cayley-Hamilton. 


Definiciones. Sea T un operador lineal en un espacio vectorial V. Un subespacio 
W de V se llama subespacio T-cíclico si existe un: elemento x EW tal que 
W es igual al subespacio generado por [x, T(x), T*(x), ...). En este caso 
decimos que W es generado por x. El subespacio T-cíclico generado por x 
será representado por C,. 


Ejemplo 25. Sea T: R?— R? definido por 
T(a, b,c) = (—b+c,a +c, 3c). 


Determinaremos el subespacio T-cíclico generado por e, = (1, 0, 0). Como 
T(e,) = T(1,0,0) = (0,1,0) =e: y T*(e,) = T(T(e,)) = T(e) = 
= (—1, 0, 0) = —e,, entonces Ce, = L({e, T(e), T?(e,),...}) = 
= L({e,, e2)) = {(s, t, 0): s, t€R). Nótese que para esta transforma- 
ción Ce, = Ce,. 


Ejemplo 26. Sea T el operador lineal en P(R) definido mediante 
T(f) = f'. Entonces C,: es igual al subespacio generado por (x?, 2x, 2) e 
igual a P,(R). 


Puede verse fácilmente que los subespacios T-cíclicos son T-invarian- 
tes. Nuestro siguiente resultado establece algunas propiedades adicionales 
de los subespacios T-cíclicos. 


Teorema 5.27. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sea W el subespacio T-cíclico de V generado por x € V. 
Supóngase que dim(W) = k > 1 (y por tanto x +0). Entonces 


(a) (3% T(x), PG), ..., T= (x)} es una base para W. 
(b) Si ~a» —a1, ..., ~a- son los escalares dados por (a) tales 
que T(x) = —ax — aT(x) — ... — ay Tx) entonces 


Et) = (—1)(a, tatt ... + ant +t) es el polinomio 
característico de Tw. 
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DEMOSTRACIÓN. Sea j el entero más pequeño para el que (x, T(x)...., 
T'(x)) es linealmente independiente. (Tal j debe existir porque W es di- 
mensionalmente finito.) Como x 40, j> 1. Por tanto (x, T(x), ...., 


T' '(x)) es linealmente independiente y T'(x) EL((x, TGD, ...T7"00)) 
de acuerdo con el lema del Teorema 1.10. Demostraremos por inducción 
matemática que T*(x) está dentro de este subespacio para cualquier entero 
no negativo s. Esto es evidente para O < s < j. Supóngase que T"(x) per- 


tenece al subespacio generado por {(x, T(x), ..., T*'(x)) para alguna 
m > j. Entonces existen escalares bo, b,, ... . b; , tales que 
T"(x) ES bx -+ b,T(x) + ... + b; ¡TPL 


Aplicando T a ambos lados de la igualdad anterior, obtenemos 


1) ALTO ED TEGO ba To). 
Luego T"''(x) es una combinación lineal de T(x), TOD. ..., F(x), 
cada uno de los cuales pertenece al subespacio generado por {x, T(x), ..., 


T'*(x)). Entonces T"''(x) pertenece a este subespacio completando la in- 
ducción. Por tanto 


W = Lx T(x), TE), ... ELA TAO... TU 00). 


Pero claramente se ve que la inclusión recíproca es también cierta y por 
lo tanto (x, T(x), ... , TY '(x)) genera a W. Como este conjunto es tam- 
bién linealmente independiente, es una base para W. Pero dim(W) = k; 
de manera que este conjunto debe contener k elementos. Por lo tanto j = k 


y entonces (x, T(x), ... , T*"(x)) es una base para W, lo que demuestra 
el inciso (a). 

Para demostrar (b), sea 8 — {x, T(x). ..., Tt '(x))] la base del inci- 
so (a) y sean - 4, “4, ..., “ar, escalares tales que T*(x) = 
— AX MVA) o ar 11% (x). Obsérvese que 

0.0 >. 0 —a, 

1 0 >. 0 —a, 

0 1 .-- 0 —a, 
LS A | 

0 0 Eta 0 —4Ak-2 

0 0 E 1 —Ak-1 


y entonces el polinomio característico de [Tw]; es 
fu) Col) ta i att... tapo A) 


por el Ejercicio 10, por lo que f(t) es el polinomio característico de Tw 
demostrando así el inciso (b). M 
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Definición. En la demostración del Teorema 5.27, la matriz 


00 >- 0 —a, 

10... 0 —a, 

0 1 --- 0 —a, 
[Tw]; = , , l , ” 

0 0 --- 0 —ay, 

0.0 «+. 1 —aj, 


se llama matriz compañera del polinomio 
f(t) = (—1)*(as +at+... + apit! + t). 


Ahora podemos demostrar el célebre teorema de Cayley-Hamilton. 
El lector deberá consultar el Apéndice E para la definición de f(T) cuan- 
do T es un operador lineal y f(t) un polinomio. 


Teorema 5.28. (Cayley-Hamilton.) Sea T un operador lineal en un espacio vec- 


torial dimensionalmente finito V y sea f(t) el polinomio característico de 
T. Entonces f(T) = To (la transformación: nula); o sea que T satisface a su 


olinomio característico. 
p A 


DEMOSTRACIÓN. Debemos demostrar que f(T)(x) = 0 para toda x€V. 
Si x=0 entonces f(T)(x) = 0 puesto que f(T) es una transformación 
lineal. Supóngase entonces que x 40 y sea W = C,. Si dim(W) = k, en- 


tonces, de acuerdo con el Teorema 5.27, existen escalares —4o, — ai, ..., 
— Ax, tales que 
T(x) = —aox — a T(x) — ... — ay T™ (x). 


Por lo tanto el Teorema 5.27 implica que 
2(0) = (Da, +att ... + apt + F) 


es el polinomio característico de Tw. Combinando estas dos ecuaciones te- 
nemos 


(T) (x) = (—1)*(al + aT +... + aya T™! + T*) (x) = 0. 


De acuerdo con el Teorema 5.24, g(t) divide a f(t); por lo tanto existe 
un polinomio q(t) tal que f(t) = q(1)g(1), y entonces 


FCT) (x) = a(T)g(T) (x) = q(T) (g(T)(x)) =q(T)(0) =0. E 


Ejemplo 27. Sea T: R?— R? definida mediante T(a, b) = (a + 2b, 
—2a + b) y sea 8 = [e,, e.). Entonces 


(12 
1= (2 1) 
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donde A = [T]g. Por lo tanto el polinomio característico de T es 


DS 


f(t) = det(A — 11) = der ( g 


2 = f£? — 
T 2t +5. 


Se puede verificar fácilmente que Tọ = f(T) = T? — 2T + 5. Del mismo 
modo 


ONS O 4 -2 —4 5 0 
FA)= A 24 +51=(—, a Jl 4 Ho 5) 
—/0 0 
0o 07) 
Ejemplo 28. Sea T el operador lineal en P.(R) definido mediante 


T(f) =f + f. Se ve fácilmente que el polinomio característico de T es 
g(t) = (1 — 1)? = —B + 3 — 31 + 1. Ahora bien, 


TO E TAI PAZ 
POEP de e E 
Por lo tanto UN 
28 (M0 = EP + 3T(f) — 31) + UN) = —f”. 
Pero para fEP.(R), f” = 0. Por lo tanto g(T) = To. 


EJERCICIOS 


1. 


2. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Sean C, y C, subespacios T-cíclicos de un operador lineal T en un 
espacio vectorial dimensionalmente finito V. Si C, = C,, entonces 
x= y. 

(b) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito, entonces C, = Cren. 

(c) Sea T un operador lineal en un espacio vectorial n-dimensional. Existe 
un polinomio g(t) de grado n tal que g(T) = To. 

(d) El polinomio característico de la matriz compañera de g(t) = 
= (—1)(a + att ... + apt t+ E) es g(t). 

(e) Un polinomio de la forma (—1)'(a, +at+ ... + a-i +) 
es el polinomio característico de algún operador lineal. 


Encontrar una base para el subespacio T-cíclico C. en cada uno de los inci- 
sos siguientes. 


(a) T: R*>R! definida mediante T(a,, a., ax, a4) = (a, + 4;, 4: — Qs, 
a, + as, a, + a) y zZ— e. 
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(b) T: P¿(R) =>P.(R) definida mediante T(f) = f” y z — x. 
(c) T: Ma (R) => Ma. (R) definida mediante 


T(A) 5A! y z= G a 


(d) T: Mae(R)—> Ma, (R) definida mediante 


a(i Ja y (2 $) 


Para cada uno de los operadores lineales T del Ejercicio 2. 


(i) Calcular el polinomio característico de Te.. 
(ii) Calcular el polinomio característico de T. 
(iii) Verificar el teorema de Cayley-Hamilton para T. 


Sea T: V— V un operador lineal, demostrar que para cualquier x €V, C, 


es T-invariante. Yo 


Demostrar el teorema de Cayley-Hamilton para matrices: Si A es una matriz 
de n x n, de polinomio característico f(t), entonces f(A) — gy es la matriz 
nula de n x n. 


Sea V un espacio vectorial bidimensional y sea T: V— V un operador li- 
neal. Demostrar. que V es un subespacio T-cíclico de sí mismo o bien 
T = Al para algún escalar A. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V, 
y sea f(1) = (— 1)" + anit +... +at + a el polinomio caracterís- 
tico de T. Demostrar que 


(a) T es invertible si y sólo si a, 2 0. 
(b) Si T es invertible, entonces 


muaa n+! 
T a T E T 
do Ao Aa 


Sea T un operador lineal en un espacio vectorial V, y sea W un subespacio 
T-invariante de V. Demostrar que para cualquier polinomio g(t), W es 
g(T)-invariante. 


Sea T un operador lineal en un espacio vectorial V. Demostrar para cual- 
quier x € V, que el subespacio T-cíclico C, es el subespacio T-invariante más 
pequeño de V que contiene a x; esto es, para cualquier subespacio T-inva- 
riante W que contenga a x, C. C W. 


10. 


11. 


12. 


5.6* 
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Sea A la matriz de k x k 


0 0 0 —a, 
10... 0 —a, 
0 l 0 —4, 
0 0 poa 0 —ak-2 
0 0 > l —a, i 
donde ao, 4,, ... , ay-, son escalares cualesquiera. Demostrar que el poli- 


nomio característico de A es 
(=1)(a, t att ... + apat +, 


Sugerencia: Utilizar inducción sobre k. 


Utilizar el Ejercicio 22 de la Sección 5.1 para obtener una demostración 
fácil del teorema de Cayley-Hamilton para operadores diagonalizables. 


Sea T un operador lineal en un espacio vectorial n-dimensional V. Demos- 
trar que el subespacio generado por (1, T, T?, .. . ) es un subespacio de £(V) 
cuya dimensión no excede a n. 


EL POLINOMIO MINIMO 


Para un operador dado T en un espacio vectorial dimensionalmente finito 
V, el teorema de Cayley-Hamilton muestra que existe un polinomio f(t) 
para el cual f(T) = Toe, que es el polinomio característico de T. Existen 
muchos otros polinomios que tienen esta propiedad. Uno de los más im- 


portantes, el polinomio mínimo, proporciona otro medio para estudiar a 
los operadores lineales. 


Definición. Sea T un operador lineal en un espacio vectorial V. Un polinomio 


p(t) se llama polinomio mínimo para T si p(t) es un polinomio mónico de 
grado positivo mínimo para el cual P(T) = To. (Recuérdese del Apéndice E 
que un polinomio mónico es aquel en el cual el coeficiente principal es 


1.) 


Es fácil ver que cualquier operador lineal T en un espacio vectorial 
dimensionalmente finito tiene un polinomio mínimo. Nótese que si g(t) 
es un polinomio de grado k con coeficiente principal a tal que g(T) = To, 
entonces A(1) = (1/a)g(t) es un polinomio mónico de grado k para el 
que A(T) - Ta. Por lo tanto el teorema de Cayley-Hamilton muestra que 


Esta sección se requiere únicamente para la Sección 6.3. 
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el grado de un polinomio mínimo para T es a lo más igual a la dimensión 
del espacio vectorial en el que T está definido. El resultado siguiente mues- 
tra que el requerimiento de que un polinomio mínimo sea mónico garantiza 
que sea único. 


Teorema 5.29. Sea p(t) un polinomio mínimo para un operador lineal T en un 


espacio vectorial dimensionalmente finito V. 


(a) Si g(t) es un polinomio cualquiera para el cual g(T) = To, en- 
tonces p(t) divide a g(t). En particular, p(t) divide al polinomio 
característico de T. 

(b) Existe únicamente un polinomio mínimo para T; esto es, p(t) 
es único. 


DEMOSTRACIÓN. 


(a) Sea g(t) un polinomio cualquiera para el cual g(T) Ae El al- 
goritmo de la división para polinomios (véase Apéndice E) implica que 
existen polinomios q(t) y r(t) tales que 


2(10) = qa (Hpt) + r), 


donde r(t) es de grado menor que p(t). Sustituyendo a T en la ecua- 
ción (8) y usando el hecho de que g(T) = p(T) = To, tenemos que r(T) = 
= Te. Como r(t) es de grado menor que p(t) y p(t) es un polinomio 
mínimo, r(t) debe ser el polinomio nulo. Luego la ecuación (8) se con- 
vierte en g(t) = q(t)p(t) demostrando (a). 

(b) Supóngase que p,(t) y p(t) son cada uno polinomios mínimos 
para T. Entonces de acuerdo con el inciso (a) p,(t) divide a p.(t). Pero 
como p,(t) y p.(t) tienen el mismo grado no negativo, debe de tenerse que 
p,(0) i= kp.(t) para algún escalar no nulo k. Además, como p, (t) y ps(t) 
son mónicos, k'= 1, por lo que p,(£) = p.(1). MW 


Antes de continuar con nuestro estudio del polinomio mínimo para un 
Operador, introduciremos el concepto de polinomio mínimo para una 
matriz. 


Definición. El polinomio mínimo p(t) para A E€ Mna (F) es el polinomio mó- 


nico de grado positivo mínimo para el que p(A) es igual a la matriz nula. 


A lo largo de este libro, los enunciados sobre transformaciones lineales 
han sido traducidos en enunciados sobre matrices y viceversa. El siguiente 
teorema y su corolario son de este tipo. 


Teorema 5.30. Sea T un operador lineal en un espacio vectorial dimensional- 


mente finito V y sea B una base para V. Entonces el polinomio mínimo 
para Y es el mismo que el polinomio mínimo para [Tlp. 


DEMOSTRACIÓN. Ejercicio. 
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Corolario. Para cualquier A EM. (E), el polinomio mínimo para A es el mis- 
mo que el polinomio mínimo para L.,. 


DEMOSTRACIÓN. Ejercicio. 


Como consecuencia del teorema anterior y su corolario, los teoremas 
siguientes de esta sección que se enuncien para operadores son también 


válidos para matrices. 
En el resto de esta sección estudiaremos principalmente polinomios 


mínimos para operadores cuyos polinomios característicos se descomponen 
en un producto de factores de grado 1. En la Sección 6.3 se hará un 
estudio más detallado de los polinomios mínimos. 


Teorema 5.31. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sea p(t) el polinomio mínimo para T. Un escalar A es 
un eigenvalor de T si y sólo si p(A) = 0. Por lo tanto el polinomid, carac- 
terístico y el polinomio mínimo para T tienen los mismos ceros. 


DEMOSTRACIÓN. Sea f(t) el polinomio característico de T. Como p(t) 
divide a f(t), f) =- q(Op() para algún polinomio q(t). Sea A un cero 
de p(t). Entonces 


IN = aAA =q0):0=0.. 
Por lo que A es también un cero para f(t); esto es, A es un eigenvalor de T. 


Recíprocamente, supóngase que A es un eigenvalor de T y sea xEV 
un eigenvector correspondiente a A. Entonces, por el Ejercicio 22 de la 
Sección 5.1, tenemos que 


0 = Ta(x) = p(T) (x) =pQ)x. 


Como x 70, p(A) -= 0 y por lo tanto A es un cero para po. E 


Como una consecuencia inmediata del resultado anterior tenemos el 
corolario siguiente. 


Corolario. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con polinomio mínimo p(t) y con polinomio característico f(t). 
Supóngase que f(t) se factoriza como 


E) = Ou = DO Do (A Ds 


donde ^i, Mo, ... , Mx son los distintos eigenvalores de T. Entonces existen 
enteros Mi, M, ... , My tales que 1 < m; < n; para toda 1 y 


P) = (t= A(t = Aa) ™ (E AD 
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Ejemplo 29. Calcularemos el polinomio mínimo para la matriz 


3-10 
A =|0 2 Oj 
l —1 2 


Como el polinomio característico de A es 
3=t -—1 0 
f(A) =det| 0 2—t 0 |= —(t— Dt — 3), 
1 =1 2—t 
el polinomio mínimo para A debe ser, de acuerdo con el corolario del 
Teorema 5.31 (1 - 2)(1- 3), o bien (1 - 2)}(t 3). Al sustituir A 


en p(t) (£ 2)(1 - 3) se demuestra que p(4) es la matriz nula; lue- 
go, p(t) es el polinomio mínimo de A. 


Ejemplo 30. Sea T: R?— R! definida mediante 
Tía, b)  (2a + 5b, 6a + b). 


Si 2 es la base estándar para R*, entonces 


5 
me (6 1) 


Así el polinomio característico de [T]g. y por tanto de T, es 


2 1 5 
NO o- der ( 6 ,) G DULA). 
Y entonces el polinomio mínimo para T debe ser (1 Tr 1 4). 


Ejemplo 31. Sea D: P.(R)—=P.(R) el operador de diferenciación de- 

finido mediante D(f) f’. Calcularemos el polinomio mínimo para D. Para 
la base B: (1,1, 1%) tenemos que 

O 1 0 

[D]; =|0 O 2 

000 


Por lo tanto el polinomio característico de D es - £%, y el corolario al 
Teorema 5.31 muestra que el polinomio mínimo para Des 1, 1 o ë. Como 
D(F) - 2.2 0, D? Z Ta, por lo que el polinomio mínimo para D debe 
ser f. 


En el ejemplo anterior es fácil verificar que P.(R) es un subespacio 
D-cíclico (de sí mismo). En este ejemplo vimos que los polinomios mínimo 
y característico fueron del mismo grado y esto no es ninguna coincidencia. 


El polinomio minimo 315 


Teorema 5.32. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Si V es un subespacio T-cíclico, o sea, si V ~ C, para al- 
guna x EV, entonces el polinomio característico f(t) y el polinomio mínimo 
p(t) para T son del mismo grado. Por lo tanto YD + (+ D*"pCco. 


DEMOSTRACIÓN. Si V es un subespacio T-cíclico, entonces existe un ele- 
mento x EV tal que 


A Taha PD) 
es una base para V (Teorema 5.27). Sea 

g) a tattoo... al, 
donde ayz- O0 y O0 <A <n. Entonces 


g(a) ax da TA) a. at) 


eeN 
es una combinación lineal de elementos de 8 que tienen al menos un 


coeficiente no nulo, el cual supondremos que es ar. Como £8 es linealmente 
independiente, g(T)(x) / 0 y por lo tanto g(T) / To. Y así el polinomio 
mínimo para T es de grado n, que es también el grado del polinomio carac- 
terístico de T. W 


El Teorema 5.32 enuncia una condición bajo la cual el grado del poli- 
nomio mínimo para un operador es tan grande como posible. Investigare- 
mos ahora cuándo el grado del polinomio mínimo es tan pequeño como 
posible. Se tiene del Teorema 5.31 que si el polinomio característico de 
un operador con A eigenvalores distintos se descompone como el producto 
de factores de grado 1, entonces el polinomio mínimo debe ser al menos de 
grado k. El siguiente teorema muestra que los operadores para los cuales 
el grado del polinomio mínimo es tan pequeño como posible son precisa- 
mente los operadores diagonalizables. 


Teorema 5.33. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Entonces T es diagonalizable si y sólo si el polinomio mini- 
mo para T es de la forma 


POD E AH Deir E AD 


donde Mi. Mo... My son escalares distintos. (Nótese que Ms Moxos An 
son necesariamente los distintos eigenvalores de T.) 


DEMOSTRACIÓN. Supóngase que T es diagonalizable y sean Ai, Az... An 
los distintos eigenvalores de T con eigenespacios correspondientes Ex,. 
Ex... ... Ea. Si dim (Es, ) ni(i 1,2... K). entonces el polinomio 
característico de T. f((), es 


SAD (A ¡DO IES a ENI pe, 
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Sea p(t) el polinomio mínimo de T y defínase 
qal) = (t=) A)... (1 — Aj). 


Demostraremos que q(T) = Te. Como de acuerdo con el Teorema 5.31 
q(t) divide a p(t), se tendrá que p(t) = q(t). Recuérdese que para cual- 
quier ¿(1 <i < Kk)x€ Ens, si y sólo si (T — A¡1) (x) = 0. Por lo tanto para 
cualquier x € En, 


aT = (T= AT = Ad) a (T àd) (x) = O. (9) 


Como T es diagonalizable, V = E, ® E, O ---GQE,, por el Teorema 
5.14. Así, de la ecuación (9), q(T)(x) =0 para toda x€V y por lo 
tanto q(T) = To. 

Recíprocamente, supóngase que existen escalares A,, Az, ..., Àx (nece- 
sariamente eigenvalores de T) tales que el polinomio mínimo, p(t), para 
T se factoriza en j 


PC) = (1= ADS A). A Az). 


Si k = 1, entonces (T — A;l)(x) = 0 para toda x €V. Por lo tanto T = Al, 
que es claramente diagonalizable. Supóngase entonces que k > 1. Sean 
{p;(t): ¡=1,2,..., k} los polinomios de Lagrange asociados con A;, 
Az... >, Ap (tal como se definieron en la Sección 1.6). La fórmula de 
interpolación de Lagrange muestra que 


k 
Y pj(t) = l, 


J=1 


donde el lado izquierdo de la igualdad es el polinomio constante 1. Por 
lo tanto 


y PD = I(x) =x (10) 
j=1 
para toda x € V. Además, la definición de polinomio de Lagrange mues- 
tra que (t — A¡)p;(t) = cp(t) donde c es un escalar. Por lo tanto 
(T= AJDP MO) =cp(T) (x) =cT,(x) = 0, 
de modo que p;(T)(x) € E,,. Entonces por la ecuación (10) 
MA E t... t E 


y así V está generado por su conjunto de eigenvectores. Por lo tanto V 
tiene una base de eigenvectores (Ejercicio 11 de la Sección 1.6), y en- 
tonces T, de acuerdo con el Teorema 5.4, es diagonalizable. MW 


Ejemplo 32. Determinaremos todas las matrices A €M: (R) para las 
cuales A? — 34 + 2/ = O donde O es la matriz nula de 2 x 2. Defínase 
8(1) =P = 314 2= (1t— 1)(1-— 2). Como g(4)=0, el polinomio 
mínimo p(t) para A divide a g(t). Por lo tanto los únicos candidatos 
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posibles para p(1) son t— 1, 1-2 o (t— 1)(1— 2). Nótese que en 
cualquiera de estos casos A es diagonalizable en virtud del Teorema 5.33. 
Sin0=t=10 p(t) = 1-2, entonces A =I o A=21. Si pD = 
-- (ft - 2), entonces A es similar a 


(o 2) 


Ejemplo 33. Demostraremos que si A es una matriz real de n xn tal 
que A* = A, entonces A es diagonalizable. Nótese que si g(1) =P — t= 
= (1+ 1)(1— 1), entonces g(4) = O donde O es la matriz nula de 
n x n. Por lo tanto el polinomio mínimo p(t) para A divide a g(t). Como 
g(t) no tiene factores repetidos, tampoco los tiene p(t). Luego, de acuer- 
do con el Teorema 5.33, A es diagonalizable. 


Ejemplo 34. En el Ejemplo 31 vimos que el polinomio mínim) para el 
operador de diferenciación D: P.(R) —=P.(R) es č. Por tant D no es 
diagonizable (Teorema 5.33). 


EJERCICIOS 


1. 


2. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Suponer en lo 
que sigue que todos los espacios vectoriales son dimensionalmente finitos. 


(a) Todo operador lineal T tiene un polinomio p(1) de grado máximo 
para el cual p(T) = To. 

(b) Todo operador lineal tiene un polinomio mínimo único. 

(c) El polinomio característico de un operador lineal divide al polinomio 
mínimo para ese operador. 

(d) Los polinomios mínimo y característico de cualquier operador diago- 
nalizable son idénticos. 

(e) Sean T un operador lineal en un espacio vectorial n-dimensional V, 
p(t) el polinomio mínimo para T, y f(t) el polinomio característico 
de T. Si f(t) se descompone en un producto de factores de grado 1, 
entonces f(£) divide a [p(t)]”. 

(f) El polinomio mínimo para un operador lineal siempre tiene el mismo 
grado que el polinomio característico del operador. 

(g) Un operador lineal es diagonalizable si su polinomio mínimo se des- 
compone en un producto de factores de grado 1. 

(h) Sea T un operador lineal en V. Si V es un subespacio T-cíclico, enton- 
ces el grado del polinomio mínimo para T es igual a dim(V). 


Calcular el polinomio mínimo para las siguientes matrices. 


(a) (21 (b) (11 (0) f4 14 5 
k 2) (o i) ( -4 2) 


l —6 4 
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11. 


Diagonalización 


Calcular el polinomio mínimo para cada uno de los siguientes operadores 
lineales. 


(a) T: P(R)—P.(R), donde T(f)=f'4 2f 

(b) T: RE=R, donde T(a, b) = (a+ b, a— b) 

O) To MaR) >M (R), donde T(4) = A'. Sugerencia: Nótese 
que T- = |. 


Determinar cuáles de las matrices y operadores de los Ejercicios 2 y 3 son 
diagonalizables. 


Describir todos los operadores lineales T en R* tales que T sea diagonali- 
zable y T* — 21: + T= T.. 


Demostrar el Teorema 5.30 y su corolario. f 
Demostrar el corolario del Teorema 5.31. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito. 
Demostrar que si g(/) es el polinomio mínimo de T, entonces 


(a) T es invertible si y sólo si g(0) +0. 


(b) Si T es invertible y g() =P" +4, "+ ... +at+ an entonces 
T'= — EE co +21). 
da do da 


Sea T un operador lineal diagonalizable en un espacio vectorial dimensional- 
mente finito V. Demostrar que V es un subespacio T-cíclico si y sólo si cada 
uno de los eigenespactos de T es unidimensional. 


Sea g(1) el polinomio auxiliar de una ecuación diferencial lincal homogénea 
con coeficientes constantes (tal como se definió en la Sección 2.7), y sea V 
el espacio de soluciones de la ecuación diferencial. Demostrar que 


la) V es un subespacio D-invariante, donde D: C* — C* es el operador 
de diferenciación. 

(b) El polinomio mínimo para D, (la restricción de D a V) es g(t). 

(c) Si el grado de g(f) es n, entonces el polinomio característico de 
D: V>oVes (—1)"e(1). 
Sugerencia: Para (b) y (c), utilizar el Teorema 2.36. 


Sea D: P(R)—=P(R) el operador de diferenciación en el espacio de todos 
los polinomios sobre R. Demostrar que no existe ningún polinomio g(r) 
para el que g(D) = T.. Por lo tanto D: P(R)—=P(R) no tiene polinomio 
mínimo. 
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12. Sea V un espacio vectorial dimensionalmente finito y sea T un operador li- 
neal en V. Supóngase que W, y W. son subespacios T-invariantes de V 
tales que V -- W, @ W- y sean p,(1) y p(t) los polinomios mínimos para 
Tw, y Tw, las restricciones de T a W, y W., respectivamente. Demostrar 
positiva o negativamente que p,(1)p.(1) es el polinomio mínimo para T. 


13.* Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
y sea W, un subespacio T-invariante de V. Si EV y x£W,, demostrar lo 
siguiente: 


(a) Existe un polinomio mónico único g,(1) de grado positivo mínimo 
tal que g (M (0) EW.. 

(b) Si h(t) es un polinomio para el cual /A(T)(x) EW,, entonces g,(1) 
divide a A(t). 

(c) Sea W. un subespacio T-invariante de V tal que W; G W,. Demostrar 
que si g.(f) es el único polinomio mónico de grado positivo mínimo 
tal que g.(T)(x) EW.. entonces g,(f) divide a g.(1). Deducir que 
g,(1) divide a los polinomios mínimo y característico de T. 


Definición. Sea T: V=V un operador lineal en un espacio vectorial dimen- 
sionalmente finito V. Para cada x no nula en Y el Traniquilador de Xx es 
el polinomio méónico p(t) de menor grado positivo para el que p (1) (0%) 
O. Obsérvese que por el Ejercicio 13(a) anterior (con W, + (03) cual- 
quier x no nula en Y tiene un T-aniquilador único. 


14.* Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
y sea x un elemento de V no nulo. 


(a) Mostrar que si q(t) es un polinomio cualquiera tal que g(T)(x) O. 
entonces p.(1), el T-aniquilador de x, divide a y(1). 

(b) Sea W C, el subespacio T-cíclico de V generado por x. Demostrar 
que el polinomio mínimo para Tw es p(t) y por lo tanto la dimen- 
sión de C, es igual, por el Teorema 5.32, al grado del T-aniquilador 
de .. 

(c) Demostrar que p,(1) es de grado I si y sólo si w es un eigenvector 
de T. 


INDICE DE DEFINICIONES PARA EL CAPITULO 5 


Aniquilador de un Determinante de un operador 
vector, 319 lineal, 236 

Cadena de Markov, 276 Eigenespacio de un operador 

Cadena de Markov lineal o matriz, 251 
absorbente, 290 Ejgenvalor de un operador 


Convergencia de matrices, 268 lineal o matriz. 235 
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Eigenvector de un operador 
lineal o matriz, 235 
Estado absorbente. 290 
Generador de un subespacio 
cíclico, 306 
Límite de una sucesión 
de matrices, 268 
Matriz compañera, 308 
Matriz de transición, 273 
Matriz escalar, 247 
Matriz regular de 
transición, 279 
Multiplicidad de un 
eligenvalor, 251 
Operador lineal, 231 
Operador lineal, o matriz, 
diagonalizable, 233 
Operadores lineales, o matrices, 
simultáneamente 
diagonalizables, 267 
Polinomio característico de un 
operador lineal o matriz, 239 


Polinomio mínimo de un operador 
lineal o matriz, 311-312 
Proceso de Markov, 276 
Proceso estocástico, 276 
Subespacio cíclico, 306 
Subespacio invariante, 298 
Subespacio invariante 
impropio, 298 
Subespacio invariante 
propio, 298 
Suma de columnas de una 
matriz, 281 
Suma de renglones de una 
matriz, 281 
Suma directa de matricgs, 301 
Suma directa de subespacios, 254 
Vector de probabilidad, 274 
Vector de probabilidad 
fija, 286 
Vector de probabilidad inicial 
para una cadena de 
Markov, 277 


- 


Capítulo S 


Formas canónicas 


6.1 


Vimos en el Capítulo 5 que para un operador lineal T en un espacio vec- 
torial dimensionalmente finito V, es benéfico descomponer a V en una 
suma directa de tantos subespacios T-invariantes propios como sea posible. 
El Ejercicio 7 de la Sección 5.4 muestra que V puede descomponerse en 
una suma directa de subespacios T-invariantes unidimensionales si y sólo 
si T es diagonalizable. En este capítulo estudiaremos especialmente la des- 
composición de V en subespacios T-invariantes propios cuando T no sea dia- 
gomalizable. Las Secciones 6.1 y 6.2 están destinadas al estudio de los 
operadores cuyos polinomios característicos se descomponen en un pro- 
ducto de factores de grado 1 y la Sección 6.3 está dedicada a los opera- 
dores lineales cuyos polinomios característicos no pueden factorizarse de 
esta manera. Estas descomposiciones conducirán a representaciones sen- 
cillas (canónicas) de tales operadores. i 


EIGENVECTORES GENERALIZADOS 


En las primeras dos secciones de este capítulo consideraremos operadores 
lineales en espacios vectoriales dimensionalmente finitos para los que el 
polinomio característico se descompone en un producto de factores de 
grado 1. (En particular, si V es un espacio vectorial dimensionalmente fi- 
nito sobre un campo algebraicamente cerrado, todo operador lineal en V 
satisface esta condición.) Tales operadores tienen al menos un eigenvalor. 
Si As, Àz.. Àn son los eigenvalores de T: V —V (no necesariamente 
diferentes), recuérdese del Teorema 5.4 que T es diagonalizable si y 
sólo si existe una base ordenada para V que esté formada por eigenvectores 


de T. Si B = [X1, Xz, - . . , Xn} es dicha base en la cual x; es un eigenvec- 
tor correspondiente al eigenvalor àj, entonces 
4, 0 > 0 
T 
[Ts a 


0.0 --- 4 
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Aun cuando no todo operador lineal T en V es diagonalizable, demos- 
traremos que para cualquier operador lineal cuyo polinomio característico 
se descomponga en un producto de factores de grado 1 existe una base 
ordenada £ para V tal que 


Ji O . 0 
O J, .. 0 
Mm =/1103,0 «DJ, = ` 
OO ... Fi 


donde J; es una matriz cuadrada de la forma (A,) o bien de la forma 


dp le 000 0 S 


O 4, 1 --- 0 0 
0.0 0 «<< 4, 1 
0.0.0 --- 0 4, 


para algún eigenvalor A; de T. A tal matriz J; se le llamará un bloque de 
Jordan correspondiente a A; y la matriz [T]; =J,0J,0 --- O J, será 
denominada forma canónica de Jordan de T. Diremos también que la base 
ordenada 8 es una base canónica de Jordan para T. Obsérvese que cada 
bloque de Jordan J; es “casi? una matriz diagonal —de hecho, [T]g es 
una matriz diagonal si y sólo si cada J; es de la forma ( Aj). 

Por ejemplo, la matriz de 8 x 8 


2 1.010 0.0 00 
02100000 
00 2i00000 
0.0 0:20 0 0.0 
a p 0 013 110.0 
0.0.0 0lo 3/00 
0.0.0 0 0 0/0 1 
0000000 


es una forma canónica de Jordan de un operador lineal T: C > C8; esto 
es, existe una base B = [x,, X2, ... , xa) para C? tal que [T]; = J. Nótese 
que el polinomio característico de T y J es det(J — 11) = (t — 2)*(1 — 
—3)*F y así la multiplicidad de cada eigenvalor es el número de veces 
que el eigenvalor aparece en la diagonal de /. Obsérvese también que de 
los vectores xı, X», ... , Xy Únicamente Xi, X4, Xs y x: (los vectores de la 
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base correspondientes a la primera columna de cada uno de los bloques 
de Jordan J,, J2, J y J,) son eigenvectores de T. 

Aunque se demostrará que todo operador cuyo polinomio caracterís- 
tico se descompone en un producto de factores de grado 1 tiene una 
forma canónica de Jordan única (de acuerdo con el orden de los bloques 
de Jordan), no significa que la forma canónica de Jordan queda comple- 
tamente determinada por el polinomio característico de la transformación. 
Por ejemplo, el polinomio característico de 


2 11000000 
021000000 
0 0/2 1/0 0 00 
palo ojo zio o oo] O5 
0.0.0 0/30 0 0 
0000 0/30 0 
00000 0'0 1 
00000000 


es también (t — 2)*(1 — 3PC. 

Considérese de nuevo a la matriz anterior J. Hemos visto que X, y x, 
son eigenvectores correspondientes al eigenvalor A, = 2, pero ni x, ni 
Xs son eigenvectores. Por lo tanto (T — 2i) (x) = (T — 21) (x,) = 0, 
mientras que (T — 21) (x,) +0 y (T — 21) (x3) +Æ 0. Pero como [T]g = J, 
T(x2) = x, + 2x2 y T(x) = x2 + 2x3. Entonces 


(T = 21)? (x2) = (T — 21) (TG) — 2x2) = (T — 21) (x) = 0, 
y, de manera semejante, | 
(T = 21)*(x3) = (T — 21).(T(x%3) — 2x3) = (T — 21)? (x) = 0. 


Luego, aun cuando (T — 21) (x,) 40 y (T — 21) (x3) 40, (T — 21)?(x.) 
= (T — 21)”(x3) = 0 si p > 2. Esta observación da lugar a la siguiente 
definición. 


Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V. Un elemento no nulo x €V se llama eigenvector generalizado de T 
si existe un escalar A tal que (T — M)"(x) =0 para algún entero positivo 
p. Diremos que x es un eigenvector generalizado correspondiente a A. 


Obsérvese que si x es un eigenvector generalizado de T correspondien- 
te a A, entonces A es un eigenvalor de T. Ahora si p es el menor entero 
positivo tal que (T — Al)*(x) = 0, entonces y =(T—AID”(x) es un 
eigenvector de T correspondiente al eigenvalor A. 

Se ve fácilmente que si 8 es una base canónica de Jordan para un 
operador T en un espacio vectorial dimensionalmente finito V, entonces 
B está formada de eigenvectores generalizados de T. El Teorema 6.4 mos- 
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trará que una base canónica de Jordan existe para todo operador V cuyo 
polinomio característico se descompone en un producto de factores de 
grado 1. La demostración de este teorema requerirá de terminología adi- 
cional que introduciremos a continuación. 


Definiciones. Sea T un operador lineal en un espacio vectorial V y sea x un 


eigenvecior generalizado de T correspondiente al eigenvalor à. Si p es el 
entero positivo más pequeño tal que (T — AI)”(x) = O, entonces el con- 
junto ordenado 


HTA (x), (T — ADA e (T = AO: a 


se llama un ciclo de eigenvectores generalizados de Y que corresponden a 
A. Los elementos (T — AI)”"(x) y x se llaman vector inicial y vector ter- 
minal del ciclo, respectivamente. Diremos también que la longitud del 
ciclo es p. 


Recorando la matriz J de la p. 322 vemos que 8, = ([X,, X», X3), Be = 
= {x} Bs = {Xs, Ye) y Ba = ([x;, xs) son cicios de eigenvectores gene- 
ralizadcs de T correspondientes respectivamente a los eigenvalores 2, 2, 
3 y 0. Sea W; el subespacio generado por 8; para I <i <4. Como 
T(x) = 2x, T(x) = x + 2x2 y T(x) = x + 2x,, W, es un subespacio 
T-invariante. De la misma manera W., W, y W, son subespacios T-inva- 
riantes. Se ve fácilmente que [Tw] =A (1 <1< 4). 

Nuestro primer resultado contiene varios resultados útiles sobre ciclos. 


Teorema 6.1. Sea T un operador lineal en N y sea y un ciclo de eigenvectores 


generalizados de T que corresponden al eigenvalor A. 


(a) El vector inicial de y es un eigenvector de T correspondiente al 
eigenvalor A y ningún otro miembro de y es un eigenvector de T. 

(b) y es linealmente independiente. 

(c) Sea B una base ordenada para V. Entonces B es una base canó- 
nica de Jordan para V si y sólo si B es una unión disjunta de 
ciclos de eigenvectores generalizados de T. 


DEMOSTRACIÓN. Demostraremos únicamente a (b); las demostraciones 
para (a) y (c) se dejarán como ejercicios. La demostración se hará me- 
diante inducción sobre la longitud del ciclo y. Si y tiene longitud 1, enton- 
ces y = [x,) es linealmente independiente puesto que x,, que es un eigen- 
vector generalizado, es un vector no nulo. Ahora supóngase que los ciclos 
de longitud k — 1 son linealmente independientes para algún entero k — 
— 1 > 1. Supóngase que y = [X,, X2, ... , Xp} es un ciclo de eigenvectores 
generalizados que corresponden al eigenvalor A y que 
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para algunos escalares a,, 4,, ... , ax. Aplicando T — Al a la ecuación an- 
terior nos da 

k 

y iX; = O. 

i=2 
Pero la suma en la igualdad anterior es una combinación lineal de elemen- 
tos de un ciclo (x,, Xx», ... , xx-1) de longitud k — 1. Por lo tanto a; = J 
para ¿=2,3,..., k, por lo que 


k 
5 aix; = 0 
i=1 
se reduce a ax, = 0. Pero como x, 440 se tiene que a, = 0, ly manera 
t 


que a, = a, = ... = az = 0, demostrando que y es linealmenté indepen- 
diente. Esto completa la inducción. W 


Recuérdese que si T es un operador lineal diagonalizable en V, enton- 
ces V es la suma directa de los eigenespacios de T (Teorema 5.14). Uno 
de los principales resultados de esta sección (Teorema 6.5) demostrará 
que si T es un operador lineal cualquiera en V cuyo polinomio característi- 
co se descompone en un producto de factores de grado 1, entonces V es 
la suma directa de los “eigenespacios generalizados” de T (los que se 
definen en seguida). Por lo tanto, como los eigenespacios de un operador 
diagonalizable proporcionaron una base para V formada por eigenvecto- 
res, los eigenespacios generalizados de un operador darán una base canóni- 
ca de Jordan para V. 


Definición. Sea A un eigenvalor de un operador lineal T en V. El eigenespacio 
generalizado de T correspondiente a A y denotado por K, es el conjunto 


K, =(íx € V: (T— AIN") =0 para algún entero positivo p}. 


Luego, Kx consta del vector nulo y de todos los eigenvectores generalizados 
correspondientes a A. 


Nuestro siguiente teorema contiene dos hechos simples sobre los eigen- 
espacios generalizados. 


Teorema 6.2. Sea à un eigenvalor de un operador lineal T en V. Entonces Ka 
es un subespacio de V que contiene a E, (el eigenespacio de T correspondien- 
te a A). 


DEMOSTRACIÓN. Es evidente que 0 €K,. Supóngase que x, y € Ka; entonces 
existen enteros positivos p y q tales que (T — A1)"(x) = 0 y (T — A1)7(y) 
= 0. Ahora bien 


A e a eA T A a T ANY) 

= (T = ADT = ADO + (ADC = ADC) 
(T — ADI(0) + (T — à1)”(0) 
=0+0=0, 
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y entonces x + y € Ka. Finalmente, para cualquier escalar c, 
(T — àl)? (cx) = c(T — A(x) = co = 0, 
tal que cx € Ka. Por lo tanto Ka es un subespacio de V. 


Es evidente que E, = N(T — M) CK. E 


Veremos en el Teorema 6.5 que K, es de hecho un subespacio T-inva- 
riante y que V es la suma directa de los eigenespacios generalizados de T. 
El teorema siguiente demuestra parte de un resultado posterior. 


Teorema 6.3. Sean A,, Az, ... , Au los distintos eigenvalores de un operador li- 


neal T en V. Entonces 
KNA Ka,) = (0) para i= 1, 2,..., K. 
j=1 
DEMOSTRACIÓN. Por conveniencia de notación consideraremos sin pérdi- 
da de generalidad que į = 1. Supóngase que 


A2X2 t ... + akXk = Xi (1) 


donde x; €K, para 1 <j < k. Sea p;(1 <j < k) el entero positivo más 
pequeño tal que (T — à;l)”(x;) = 0. Supóngase que x, > 0; entonces 
(T — Ar1)”"(x,) es un eigenvector correspondiente al eigenvalor A,. Apli- 
cando (T — A,1)?U(T — 221)? ... (T— Axl)” a ambos lados de la ecua- 
ción (1) se tiene 


0 = (T=ADYUT — àd)... (T — Asl) (x) 
= (T — A)... (T — Ad) (T > l)e )) 
= (M — M)... (Ar — A)T — àd)aa (x) 
en virtud del Ejercicio 22 de la Sección 5.1. Por lo tanto dado que 


Ais Az, ... , Az son distintos, (T — Ar1)?%"(x,) = 0, contradiciendo el que 
(T — àl) (x,) sea un eigenvector. Concluimos que x, = 0. MW 


Corolario. Ningún vector puede ser un eigenvector generalizado correspondien- 


Lema. 


te a eigenvalores diferentes del mismo operador. 


Estamos ahora preparados para demostrar la existencia de una forma 
canónica de Jordan para cada operador lineal en un espacio vectorial dimen- 
sionalmente-finito cuyo polinomio característico se descomponga en un 
producto de factores de grado 1. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito 
V. Sea S¡(1l <i < k) un ciclo de eigenvectores generalizados de T. corres- 
pondientes al eigenvalor A y sean p; y y; la longitud y el vector inicial de 
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S;, respectivamente. Si [y,, Y2, ... , Yx} es un conjunto linealmente indepen- 
diente que contiene k elementos, entonces 

k 

U S; 

i=1 


es un conjunto linealmente independiente que contiene 
k 
È Pi 
i=1 


elementos. 


DEMOSTRACIÓN. —Supóngase sin pérdida de generalidad que p, > p: > ... 
... > Pk. La demostración se hará por inducción sobre p,. Si p, + 1, en- 
tonces pı = ... = P = 1. Por lo tanto, cada ciclo S, contiene Jn solo 
elemento, de modo que 


k 
US = {Vi Jo. Ya) 


es un conjunto linealmente independiente que por hipótesis contiene 
k 
A 
i=1 


elementos. 

Ahora supóngase que el teorema es cierto siempre que pı < n y sea 
Si(1<i<k) un ciclo de eigenvectores generalizados de T correspon- 
dientes al eigenvalor A con longitud p; y vector inicial y;. Supóngase que 
n = P > Pe >... > Pky sea r(l <r< k) el subíndice más grande tal 
que p, > 1. Sea 


k 
S = U Si 
d=1 


y sea S (1 <i< r) el ciclo obtenido al suprimir el vector terminal x; 
de S;. Entonces S; es un ciclo de eigenvectores generalizados que corres- 
ponden al eigenvalor A con longitud p; — 1 y vector inicial y;. Como 


Di... > yr) es linealmente independiente, se tiene por la hipótesis de 
inducción que 


S =| S; 
i=1 
es un conjunto linealmente independiente que contiene 
T 
> (pi — 1) 
i=1 
elementos. Es evidente que 


k 
U S= S'U lp... Xa) 
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es una unión disjunta. Entonces 


k 
U S: 
i=l 
contiene : 
T k k 
DSD TESS E p 
i=1 i=1 i=1 
elementos. 
Necesitamos demostrar únicamente que 


k 
S=] S; ) 
f=1 


es un conjunto linealmente independiente. Supóngase que para algunos 
escalares a; 
Y azo; (2) 
ES 
Como, de acuerdo con el Teorema 6.1(a), y, es un eigenvector de T 
correspondiente al eigenvalor A, (T — Al) (y:) = 0 para 1 < i < k. Por lo 
tanto, al aplicar T — Al a ambos lados de la ecuación (2), obtenemos 
0= Y a(T — ADG)= $ a (T —4DG), (3) 
zES zEeZ 
donde Z = {v €S: v Æ y; para 1 < i < k}. Pero la suma final en la ecua- 
ción (3) es una combinación lineal de elementos de S", luego como S' 
es linealmente independiente, se tiene que a, = O si z €Z. Luego la ecua- 
ción (2) se reduce a una combinación lineal de (y,, y», ... , yx), la cual 
es, por hipótesis, linealmente independiente. Por lo tanto, todos los coefi- 
cientes a. de la ecuación (2) son iguales a cero, demostrando que S es 
linealmente independiente. MW 


Ejemplo 1. Sea T: C“ > C“ un operador lineal cuyo polinomio caracte- 
rístico se descompone en un producto de factores de grado 1. Este ejemplo 
y el Ejercicio 8 ilustran la manera cómo una base canónica de Jordan y 
para la restricción de T a R(T) se extiende a una base canónica de Jor- 
dan £ para T en el Caso 1 del Teorema 6.4. Supóngase que y = {yı, Wi» 


Ya, Vi, Vo, Va) y que 


01:000 0 
0.00 0.0 0 
0 0:00 0 0 
al E A , 
a PE 1:10 
0 0 0;0 210 
00 0 00:3 
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donde T, denota la restricción de T a R(T). Entonces {y wih [y.), ([v,, 
va} y {v}, que son los ciclos que componen a y, corresponden respectiva- 
mente a los eigenvalores O, 0, 2 y 3. En la notación del Teorema 6.4, yo, 
la unión de los ciclos correspondientes a 0, es igual a (y,, wi} U (y»2). 
Entonces Y = ([y,, y.) (el conjunto que contiene a los eigenvectores con- 
tenidos en y que corresponden a cero) es un subconjunto linealmente 
independiente de N(T) que puede ser extendido a una base Y U Z = (y,, 
Ya, Zi, Zo, Z4} para N(T). Finalmente, escójase a x, y x» tales que T(x,) = 
= w y T(x.) = y». Entonces [y,, wi, Xi}, (Yo, X2}, {zı}, (22) y {z:} son 
ciclos de eigenvectores generalizados de T correspondientes al eigenvalor 
cero y B = {Yyi, Wi, Xi, Yos Xo, Vi, Va, Va, Za, Zo, Za} es una |base ordenada 
para C", Obsérvese que J 


01000000000 
0.0 1:00000000 
00000000000 
0 0 0:0 1i100000 0 
o0 000000000 

msloo 0 0012 110 0 0 0l 
000000 21000 0 
000000030 0 0 
0000000 0/0/00 
0000000 0 0/00 
000000000 00 


Teorema 6.4. Sea T un operador lineal en un espacio vectorial n-dimensional V 
tal que el polinomio característico de Y se descompone en un producto de 
factores de grado 1. Entonces existe una base canónica de Jordan para T, 
esto es, existe una base ordenada B para V que es una unión disjunta de 
ciclos de eigenvectores generalizados de T. 


DEMOSTRACIÓN. La demostración se realizará por inducción sobre n. 
Es evidente que el resultado es cierto para n = 1 pues toda matriz de 
] x 1 es una forma canónica de Jordan. Supóngase que la conclusión 
es cierta para espacios vectoriales de dimensiones menores que n y que 
dim(V) = n. Consideraremos dos casos. 


Caso 1. rango(T) < n. Puesto que R(T) es un subespacio T-invariante 
de V podemos definir a T: R(T) => R(T) como la restricción de T a R(T). 
La suposición del Caso | nos permite utilizar la hipótesis de inducción e 
T, para concluir que existe una base canónica de Jordan y para T, que 
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contiene r elementos (r < n). Por lo tanto, en virtud del Teorema 6.1(c), 
y es una unión disjunta de ciclos de eigenvectores generalizados de T, (y 
por tanto de T). Sean S,, $», ... , Sx todos aquellos ciclos en y que corres- 
ponden al eigenvalor cero, y sean y; y w; respectivamente los vectores 
inicial y terminal de S;. Como w; Ey C R(T), existe x;€V tal que 
T(x;) ¡= w;. Ahora defínase Y = (y, Ya, ... , yx), X = A Xk} 
y 


f=1 

Supóngase que yo contiene p elementos (p < r). Recuérdese dl Teorema 
6.1(a) que cada y; es un eigenvector que corresponde al eigenvalor cero; 
por tanto Y C N(T). Luego, como Y es linealmente independiente (es un 
subconjunto de y), puede ser extendido hasta una base Y U Z para N(T). 
Obsérvese que Z debe contener n — r— k elementos puesto que nuli- 
dad(T) = n — rango(T) = n — r. Sea S = Si U (x;); entonces S% es 
un ciclo de eigenvectores generalizados de T que corresponden al eigen- 
valor cero y que tiene como vector inicial a y;. Además, si z € Z, entonces 
{z} es un ciclo correspondiente al eigenvalor cero cuya longitud es 1. 
Por lo tanto el lema implica que 


(Ushuz=WMmuxuz 


es un conjunto linealmente independiente que contiene p + k + (n — r — 
— k) =n — (r — p) elementos por el hecho de ser Y U Z un conjunto 
linealmente independiente de vectores iniciales para los ciclos que corres- 
ponden al eigenvalor cero. 

Demostraremos que 8 = y U X U Z es la base que se desea encontrar. 
Primero, obsérvese que si yo = y (de manera que p = r), entonces B= 
=y UXUZ es un conjunto linealmente independiente que contiene 
n — (r— p) = n elementos. Entonces 8 es una base para V. De lo con- 
trario, si yo Æ y, entonces y, = (vEy: vé yo) es una unión no vacía de 
ciclos disjuntos de eigenvectores generalizados que corresponden a eigen- 
valores no nulos Az, ... , Am de T. Supóngase que 


0O=Y)av= Y av+ Y ay. 


vef vEyou Xuz vEy 
Entonces 


(—a,o => >, a,v. 


vEyovXuzZ vEyi 


Pero el lado izquierdo es un elemento de Ka, donde à, = 0 y el lado 
derecho es un elemento de Ka, + ... + Ka. Por lo tanto de acuerdo 
con el Teorema 6.3, ambos lados de la igualdad anterior son iguales a 0. 
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Así, como yo U X U Z y y, son conjuntos linealmente independientes, se 
tiene que a, = O para toda v€fB. Por lo tanto £ es linealmente indepen- 
diente, y como 8 = y U X U Z contiene r + k + (n — r — k) = n ele- 
mentos, $ es una base para V. Pero es evidente que £ es una unión disjunta 
de ciclos de eigenvectores generalizados de T, de modo que £ es una base 
canónica de Jordan para T por el Teorema 6.1. 


Caso 2. rango(T) = n. Como el polinomio característico de T se des- 
compone como un producto de factores de grado 1, T tiene un eigenvalor 
A. Utilícese el Caso 1 para el operador no invertible T A en V para 
obtener una base ordenada f£ para V tal que [T — Al]şs = J sed una forma 
canónica de Jordan para T — Al. Pero entonces [T]g = J + Al, es una for- 
ma canónica de Jordan para T. MW 


Habiendo establecido la existencia de una forma canónica de Jordan, 
ya podemos obtener varias propiedades importantes de los eigenespacios 
generalizados. 


Teorema 6.5. Sea T un operador lineal en un espacio vectorial dimensionalmen- 
te finito V tal que el polinomio característico de T se descomponga en un 
producto de factores de grado 1. Supóngase que M, dz, ... , Ay son los 
distintos eigenvalores de T y que la multiplicidad de à; es m;i(1 < i < k) 
y sea B una base canónica de Jordan para T. Defínase a Bı = B N K1 (1 < 
< 1 < k). Entonces 


(a) VW=K,OK,0O ::: OK, 

(b) f, es una base para K,,. Recíprocamente, si para cada i A; es 
una unión de ciclos de eigenvectores generalizados correspondien- 
tes a A; que constituye una base para Ka, entonces 


k 
U Yi 
es una base canónica de Jordan para T. 
(c) Kid <i<k) es un subespacio T-invariante de V. 
(d) Para cada i(1 <i<k), dim(K,,) = mi. 
(e) Para cada i(1 <i <k), Ka, = N((T — AD". 
(f) T es diagonalizable si y sólo si Er, = Ka, para cada i(1 <i < 
<k). 


DEMOSTRACIÓN. 
(a) Es evidente que L(8:) C Ka,. Pero como 


(Ù p,) = L(B) = V, 


i=1 
se tiene que Ka, + Ka, +... + Ka, = V. El inciso (a) ahora puede de- 
ducirse a partir del Teorema 6.3. 
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(b)  Defínase a W; como el subespacio generado por f; para 1 < 
<i< k. Entonces W; C Kar, y por lo tanto dim(W;,) < dim(Ka,). Pero 
como f£ es la unión disjunta de B,, Bz, ... , Bx y L(8) = V, se tiene que 
V=W,0W,0--: OQ W,. Luego del inciso (a) tenemos que 


5 k 
dim(V) = $ dim(W;) < Y dim(K\,) = dim(V). 
ipl i=1 
Por tanto dim(W;) = dim(K,1,) para 1 <i < k. Dado que W; C Ka, y 
dim(W;) = dim(K\,), se tiene que L(8:) = W; = Ka,. Como £; es lineal- 
mente independiente (es un subconjunto de 8), 8; es una base para Ka, . 

La recíproca se obtiene del inciso (a) y de los Teoremp 5.13 y 
6.1(c). 

(c) Recuérdese que Ka, es un subespacio de V (Teorema 6.2). Ahora 
bien, 8; es una base para Ka, formada por ciclos de eigenvectores ge- 
neralizados que corresponden a A;. Pero la imagen bajo T de cualquier 
vector en un ciclo es claramente una combinación lineal de vectores en 
dicho ciclo y en consecuencia es un elemento de K,,. Luego T(fB,) S Ka 
demostrando así que Ka, es T-invariante. 

(d) Defínase a T;(1 <i < k) como la restricción de T a Ka, Enton- 
ces, de acuerdo con el inciso (b), A, = [T;];, es una forma canónica de 
Jordan para T; y [T]; = 4104,0 DD A, Si n; =dim(K,), entonces 
el polinomio característico de T; es det(4; — t1,) = (å; — t)" puesto que 
A; — tla, es una matriz triangular superior que tiene a à; — t en cada 
posición diagonal. Si f(t) es el polinomio característico de T, entonces 


HF) = det(A, — tln,) © det(A. — tIn,) ©... © det(Ay — tln,) 
= (Ar — t(s — t)... (Ag t). 


Por lo que la multiplicidad de A; es n;; o sea, m; = n; = dim(Ka,). 

(e) Es evidente que N((T — 4,¿1)") < K,. Supóngase que x € Ky 
Entonces el ciclo S con un vector terminal x, de acuerdo con el Teore- 
ma 6.1, es un subconjunto de Ka, linealmente independiente. Como dim 
(Ka) = m, se tiene que la longitud de S no puede exceder a m;i; esto es, 
(T — A¡1)"(x) = 0 para algún entero positivo p < m;. Por lo tanto 
xEN((T — A¡1)"*), demostrando así que Ka, C N( (T — Aj1)”). 

(£) Si Er, = Ka, para 1 < i< k, entonces, de acuerdo con el inci- 
so (a), 


EL DE.LO OE. = Ka, OKO- OK, =V 


y así, por el Teorema 5.14, T es diagonalizable. 

Recíprocamente, si T es diagonalizable entonces dim(E, ) = mm; por 
el Teorema 5.14. Pero como Ea, es un subespacio de Ka, y dim(Ka,) = 
= m,, por el inciso (d), se tiene que Ea, = Ka, para 1< ¡¿< k. J 
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Ejemplo 2. Sea T: C?— C? definida mediante T = L,, donde 


3 1-2 
A=|-1 0 sl 
hi A 


Encontraremos una base para cada eigenespacio y cada eigenespacio gene- 
ralizado de T. 
El polinomio característico de T es 


f(t) = det(A — tl) = —= (1 -— 3) (1 — 2)’. 
Por lo tanto A, = 3 y A, = 2 son los eigenvalores de T con multiplicidades 
1 y 2, respectivamente. De acuerdo con el Teorema 6.5, Ka, tiene dimen. 
sión 1, Ka, tiene dimensión 2 y también Ka, = N(T— 31) y K p, =N 
((T — 21)*). Ahora bien Ea, = N(T — 31) y Er, = N(T — 21). Por lo 
tanto Er, = Ka, Como 


"0 1 2 a 
A-—3l=|-1 -—3 5j, b |e E, =K, 
—1 —1 1 c 


si y sólo si 


0 1 —2\/a 0 
—1 —3 Si bli=0i0)], 
—1 —l! lc 0 


o, de manera equivalente, si y sólo si 


a 
b 
c 
es una solución del sistema 
b—2c=0 
(a —3b+ 5=0 
~a — b+ c=0. 


Por el hecho de que el conjunto de soluciones del sistema anterior tenga a 


como base, 


es una base para Ea, = Ka,. 
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Análogamente, como 


l 1 —2 a 
A-2I=|-1 -2 5), b |e E, 
=1 —1 2 c 
si y sólo si 
1 l1 —2\/a 0 
1-2 Sib] ]=|0 
—1 —1 2Mc 0 


o, de manera equivalente, si y sólo si 


; ] 


es una solución del sistema l 
a+ b-—2c=0 
—a — 2b + 5c =0 
—a— bw 2c=0. 
Una base para el conjunto de soluciones de este sistema, y por tanto para 
Ea, €S 
1 
—3 
—1 
Como 
2 1 —1 a 
(A — 2D”? =|-4 -2 2], b |€ K, 
—2 —l 1 c 
si y sólo si 
a 
b 
c 


es una solución del sistema 
2a+ b— c=0 
—4a — 2b + 2c = 0 
—2a — b+ c=0. 


Una base para el conjunto de soluciones de este sistema, y por tanto para 
Ka,, €s 
MN /—1 
—3 |, 2 
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Obsérvese que esta base es un ciclo de eigenvectores generalizados corres- 
pondientes a Az. Por lo tanto de acuerdo con el Teorema 6.5(b) 


—1 l —1 
$= 21 1—3) 2 
l —]1 0 


es una base para C? y 
3050 
0 0 2 


es una forma canónica de Jordan para T. z 
Ejemplo 3. Sea T: P¿(C)— P(C) definida mediante T(f) = —f — f. 
De nuevo encontraremos una base para cada eigenespacio y cada eigenes- 
pacio generalizado de T. Si 8 = {1, x, x?), entonces 8 es una base orde- 
nada para P(C) y 


=1 -—1 0 
A=M,=| 0 —1 -—2]. 
0 0 —1 
Por lo tanto el polinomio característico de T es f(t) = det(A — tI) = — 
— (t + 1)?. Entonces à = —1 es el único eigenvalor de T y por lo tanto, 


de acuerdo con el Teorema 6.5, Ką = P(C) y así cualquier base para 
P¿(C), por ejemplo 8, es una base para Ka. Ahora bien, E, = N(T — 
— A) = N(T + I). Entonces si f(x) = a + bx + cx? € P(C), se tendrá 
que f(x) € Ex si y sólo si 


0 = T(f(x)) + f(x) 


[—(a + bx + cx?) — (b + 2cx)] + (a + bx + cx?) 
— (b + 2cx). 


Il 


j 


Il 


Pero —(b + 2cx) = 0 si y sólo si b = c = 0. Por lo tanto f(x) € En si 
y sólo si f(x) = a para alguna a €C y entonces {1} es una base para En. 

Como Ka, = P.(C), deben existir ciclos de eigenvectores generalizados 
correspondientes a A que formen una base canónica de Jordan para T. 
De hecho, se tiene del Ejercicio 4 que un ciclo único (de longitud 3), y 
no la unión de dos ciclos (uno de longitud 2 y el otro de longitud 1) 
ni la unión de tres ciclos (todos de longitud 1), formará una base para 
P,(C). Tal ciclo es y = {2, —2x, x?) y 


1.1.0 
M,=| 0 -1 ı 
0 0-1 


es una forma canónica de Jordan para T. Veremos en la sección siguiente 
cómo encontrar tal base canónica de Jordan. 
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EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Los eigenvectores de un operador lineal T son también eigenvectores 
generalizados de T. 

(b) Es posible que un eigenvector generalizado de un operador lineal T 
esté asociado con un escalar que no sea un eigenvalor de T. 

(c) Cualquier operador lineal en un espacio vectorial dimensionalmente 
finito tiene una forma canónica de Jordan. 

(d) Los ciclos de eigenvectores generalizados son linealmente indepen- 
dientes. S 

(e) Existe exactamente un ciclo de eigenvectores generalizados corres- 
pondientes a cada eigenvalor de un operador lineal en un espacio 
vectorial dimensionalmente finito. 

(f) Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito cuyo polinomio característico se descompone en un producto 
de factores de grado 1, y sean ài, A», ... , Az los distintos eigenvalo- 
res de T. Si, para cada i, 8; es una base cualquiera para K,,, entonces 
PURU... U Br es una base canónica de Jordan para T. 

(g) Para cualquier bloque de Jordan J, L; tiene una forma canónica de 
Jordan J. 

(h) Sea T un operador lineal en un espacio vectorial n-dimensional cuyo 
polinomio característico se descompone en un producto de factores 
de grado l. Para cualquier eigenvalor A de T, Ka = N((T — al)”). 


Para cada uno de los siguientes operadores lineales T, encontrar una base 
para cada eigenespacio y para cada eigenespacio generalizado. 


(a) T=L,, donde 


(b) T= Li, donde 


ll —4 —5 
A=|21l —8 —Iil 
3 =l 0 


(c) T: PC) =>P.(C) definido mediante T(f) = 2f — f 


Sea $ un ciclo de eigenvectores generalizados de un operador lineal T en 
V que corresponde al eigenvalor A. Demostrar que el subespacio generado 
por $ es un subespacio T-invariante de V. 
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Sea 8 una base canónica de Jordan para un operador lineal T en V y sea 
[T] = 07.0 ::: DJ, donde cada J;¡(1 <i<k) es un bloque de 
Jordan. Sea A un eigenvalor de T y sea m el número de bloques de Jordan 
que tienen a A en cada una de las posiciones de la diagonal. Demostrar que 
1 <m < dim(Er). Veremos más adelante que m = dim(E,). 


Sea T: V— W una transformación lineal. Demostrar los incisos siguientes: 


(a) N(T) = N(—T). 

(b)  N(T) = N((—T)*) para cualquier entero positivo k. 

(c) Si W=V (tal que T es un operador lineal en V) y A es un eigen- 
valor de T, entonces para cualquier entero positivo k 


N(T — 2195 = N((ly — DS). N 


Sea U un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demcstrar los siguientes incisos: 


(a) N(U) E N(U?) C... E N(U*) G N(=) G... 

(b) Si rango(U”) = rango(U”*!) para algún entero positivo m, entonces 
rango(U”) = rango(U*) para cualquier entero positivo k > m. 

(c) Si rango(U”) = rango(U”*!) para algún entero positivo m, entonces 
N(U") = N(U*) para cualquier entero positivo k > m. 

(d) Sea T un operador lineal y sea A un eigenvalor de T. Demostrar que 
si rango((T — Al)”) = rango((T — Al)”*!) para algún entero m, en- 
tonces Ka = N((T — Al)”). 

(e) Segunda prueba para diagonalizabilidad. Sea T un operador lineal 
cuyo polinc:mio característico se descompone en un producto de fac- 
tores de grado 1. Supóngase que ài, Ao, ... , Ax SON los distintos 
eigenvalores de T. Entonces T es diagonalizable si y sólo si rango(T — 
— àil) = rango((T — A¡1)*) para 1< i¿<k. 

(f) Utilizar el inciso (e) para obtener una demostración más sencilla del 
Ejercicio 10(d) de la Sección 5.4: Si T es un operador lineal diago- 
nalizable en un espacio vectorial dimensionalmente finito V y W es 
cualquier subespacio T-invariante de V, entonces Tw es diagona- 
lizable. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que el polinomio característico f(t) de T se descompone en un producto 
de factores de grado 1. Demostrar que f(T) = To; esto es, demostrar que T 
satisface a su polinomio característico. (Este es un caso especial del Teo- 
rema de Cayley-Hamilton.) Sugerencia: Demostrar que si 4 es una base 
canónica de Jordan para T, entonces f(T)(x) = O para cada x€ f. 


Este ejercicio tiene como finalidad ilustrar la demostración del Caso 1 del 
Teorema 6.4 para una transformación lineal particular T: CU —> C". (Ver 


también el Ejemple 1.) 
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Sea T: C1Cu definida mediante 


T(u) = (a, + 2a, — az, —a, — Sa, + 3a, —2a, — Ta: + 4a,, 


6a, — 9a;, 4a, — 64;, as + ar, —4s + 3a,, 3%, O, O, 0), 


donde u = (a, az, as, A4, 05, Ae, Ar, Ag, Ao, Gro, A11). 


(a) 


(b) 
(c) 
(d) 


(e) 
(£) 


(g) 


(h) 


(i) 


= 2e, — 3e: — Sez, Y: = 3€, + 2es, vi = es + e, Vz} 3e, +4e, y 
Vs = ez. Demostrar que y es una base ordenada para/R(T). Sugeren- 
cia: Tomando a u como en el párrafo anterior 


Sea Y = {Yis Wis Y2, Vis Va, va), donde Y: = €; pea y Ena 3e, Wi = 


T(u) = (—a, + 4a, — 3a;)y, + (a, — a, + as)w, + (2a, — 3as) y, 
+ (Tas EN Sa,)v, + (— 2as + 241) v, + (3as) vs. 


Dedúzcase que r, el rango de T, es igual a 6 y que la nulidad de 
Tes 5. 

Sea T, la restricción de T a R(T). Demostrar que y es una base 
canónica de Jordan para T,. 

Demostrar que S, = (y,, W1), Sa = {y2}, Sa = {v va) y Si = ([vs) 
son ciclos de eigenvectores generalizados de T, correspondientes res- 
pectivamente a los eigenvalores 0, 0, 2 y 3. (Por lo cual, en la nota- 
ción de la demostración del Teorema 6.4, k = 2, yo = {Yı, W1, Y2} y 
p=3.) 

Sean x, = —e, + Se, + 7e y X= 8e, + 5e;. Demostrar que 
T(x;) = w; para i = 1, 2. Hágase X = (x,, x2}. 

Obsérvese que en la notación de la demostración del Teorema 6.4 
los vectores yz y wz son iguales, y hágase Y = (y,, y2}. Defínanse 
Zı — e», Z2 = €i Y Za = €11. Demuéstrese que Z = (Z,, Zz, Z3} es un 
conjunto (que contiene n — r — k elementos) tal que Y U Z es una 
base para N(T). 

Defínanse S! = (y,, wi, xı} y S, = (wz, X2}. Demostrar que S' y 
S, son ciclos de eigenvectores generalizados de T correspondientes al 
eigenvalor cero. Entonces, de acuerdo con el lema del Teorema 6.4, 


(Us)juz=1wuxuUz 


es un conjunto linealmente independiente que contiene a n— (r — 
— p) = 8 elementos. 

La demostración del Teorema 6.4 muestra que B=yUXUZ es 
un conjunto linealmente independiente. Considerando este hecho de- 
dúzcase que f es una base para C!!, 

Finalmente, demostrar que 8 es una base canónica de Jordan para T 
mediante el cálculo de [T]g. 


9. Demostrar los incisos (a) y (c) del Teorema 6.1. 


10. 


6.2 
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Sea T un operador lineal en un espacio vectorial dimensionalmente finito. 


Supóngase que A;, Az, ... , àx son los eigenvalores distintos de T y que el 


mayor bloque de Jordan correspondiente a A; en una forma canónica de 
Jordan de T es de tamaño p; x pj. Demostrar que el polinomio mínimo 


de T es 
(1 —= APA — M)... (1 A). 


FORMA CANONICA DE JORDAN 


Para los fines de esta sección fijaremos un operador lineal T en un espacio 
vectorial n-dimensional V tal que el polinomio característico de T se des- 
compone en un producto de factores de grado 1. Sean A,, Az, ... , Ax los 
distintos eigenvalores de T. 

El Teorema 6.4 asegura la existencia de una base canónica de Jordan 
B para T; esto es, J = [T]g es una forma canónica de Jordan para T. Resu- 
mamos brevemente los resultados de la Sección 6.1. Para cada i= 1, 


2,... k existe una base g; para Ka, tal que 8; es una unión disjunta 
de ciclos correspondientes al eigenvalor A; y 
k 
B=Ú Bo 


Sea T; la restricción de T a K,,. Entonces A; = [T;]g, es una forma ca- 
nónica de Jordan para T; y 


J = [T]; =4104:0 DA 


es una forma canónica de Jordan para T. 

En esta sección calcularemos las matrices Æ; y las bases 8; calculan- 
do también así J y 8. Mientras se desarrolla un método para encontrar a 
J, se hará evidente que en cierto sentido las matrices A; son únicas. Lo 
que queremos decir por “en cierto sentido” se hará más claro a medida que 
avancemos. 

Para ayudarnos en la formulación de un teorema de unicidad para J 
adoptaremos la siguiente convención: La base f; para K\, se ordenará 
en adelante de tal modo que los ciclos aparecerán en orden de longitud 
decreciente. Esto es, si 8; es una unión disjunta de ciclos $i, S,, ..., Sy, 
y si la longitud del ciclo S$; es pj, pondremos índices a los ciclos de modo 
que pı > p: > ... > Ppx,. Esta ordenación de los ciclos determina una or- 
denación para 8; y por lo tanto determina a la matriz A;. Es en este sentido 
que la matriz A; es única. Se deduce entonces que la forma canónica de 
Jordan para T es única para un ordenamiento de los eigenvalores de T. 
Como también veremos, no existe ningún teorema de unicidad comparable 
para las bases 8; o para 8. Específicamente, lo que se demostrará es que 
el número k; de ciclos que forman a £; y la longitud p; (j= 1,2, ...,Kk;) 
de cada ciclo está completamente determinada por T. 


Es 
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Ejemplo 4. Para ilustrar que la matriz A; queda totalmente determinada 
por los números kı, Pı, P2,..., Pr; Supóngase que k; = 4 (esto es, exis- 
ten cuatro ciclos), p, = 3, p: = 3, pa = 2 y p, = 1. Entonces 


à 1.00 0.0 0 0.0 
0 4, 110 0.0 0 0.0 
0.0 24,0 0.0 0 0 0 
o o oia 1 00 0 0 ) 
a=|0 0 0'0 24, 1/0 0 0f 
0 0 0:0 0 4'0 0 0 
0.0.0. 0.0 0124 110 
0.0.0 0 0 0:;0 2, | 0 
0.0.0.0.0.0.0.0/% 


esto es, A; es una suma directa de la forma J, ALAJ OJ. 


Como una ayuda para calcular A; y f; introduciremos un arreglo de 
puntos, llamado diagrama de puntos, para ayudarnos a visualizar la for- 
ma de la matriz A, y de la base f8;. Supóngase, como antes, que 8; es una 
unión disjunta de ciclos S,, Sa, ... , Si, con longitudes respectivas p, > 
> P: >... > Ph. El diagrama de puntos contiene un punto para cada 
miembro de 8; y se construye de acuerdo con las reglas siguientes. 


1. El arreglo consta de k; columnas (una columna para cada ciclo). 
Contando de izquierda a derecha, la columna j consta de p; pun- 
tos que corresponden a los miembros de $; de la siguiente manera: 
Si x; es el vector terminal de S; entonces el punto de arriba co- 
rresponde a (T — Aj¡1)”""(x;); el segundo punto, a (T — A¡¿1)?? 
(x;); etc. Por lo tanto, el punto final (el de más abajo) de la 
columna corresponde a x;. 


Así, el diagrama asociado con f; puede ser descrito como 


(T = A) AT e A ACTA 
(T — AU) (T — 4/1) Ux)) (T — A 107 (ak) 
; (T — m 
y (T — A,0)G<,) Xk 
(T — A(x) "X2 
Xi 


En el diagrama anterior hemos identificado cada punto con el miembro 
de 8; al que corresponde. 
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Nótese que el diagrama de puntos para f; tiene k; columnas (una 
para cada ciclo) y p, renglones. Obsérvese también que como p, > p: > 
>... >Px,, las columnas del diagrama de puntos se hacen más cortas 
(o al menos no más largas) a medida que nos movemos de izquierda a 
derecha. 

Puede observarse también que si r; es el número de puntos en la 
columna j del arreglo, entonces r, > r > ... > r,,. Como la demostra- 
ción de este hecho es de naturaleza combinatoria, la dejaremps para los 
ejercicios. 

Regresando al Ejemplo 4, donde k; = 4, pi = 3, P: = 3, p.=2 y 
ps = 1, vemos que el diagrama de puntos para 8; es 


Obtendremos un método para calcular el diagrama de puntos para £; 
únicamente en términos de T, por lo que el diagrama de puntos queda deter- 
minado en forma única por T. Es importante, sin embargo, entender que 
cuando decimos que el diagrama de puntos queda únicamente determinado 
por T no estamos haciendo aseveraciones sobre la unicidad de f;. De he- 
cho, como veremos, la base 8; no es única. Por la unicidad del diagrama 
de puntos entendemos que si 8; y f” son dos bases canónicas de Jor- 
dan para Ka, entonces los diagramas de puntos para 8; y 8’, son idénti- 
cos. Luego, si 8% es una unión disjunta de k' ciclos de longitudes 
Pi Ph ""* > Pi, entonces k) = k, y Pi = Pi Ph = Pos ->s Ph = Pre 

Para establecer este resultado de unicidad, utilizaremos el siguiente he- 
cho de carácter combinatorio: Cualquier diagrama de puntos queda comple- 
tamente determinado por el número de sus renglones y por el número de 
puntos en cada renglón. (Véase Ejercicio 7.) Así, si estos números pudieran 
obtenerse a partir de las propiedades intrínsecas de la transformación T 
(por ejemplo, como los rangos de (T — a;¡l)' para distintos valores de j), 
se podría construir el diagrama de puntos y se demostraría la unicidad de 
los números ki, Pi, P»,..., Pr,- Los resultados siguientes proporcionan el 
método deseado para calcular dichos números. 


Teorema 6.6. Para cualquier entero positivo r los vectores de la base en Bj 
que estén asociados con puntos en los primeros r renglones de un diagrama 
de puntos para fB; forman una base para N((T — A¡1)*"). Por lo tanto, el 
número de puntos en los primeros r renglones de un diagrama de puntos 
para Bf; es la nulidad de (T — àil)". 


DEMOSTRACIÓN. Los vectores de la base en 8; que están asociados con 
puntos en los primeros r renglones de un diagrama de puntos para 8; son 
los primeros r elementos de los ciclos S;(j= 1, 2, ... , ki) que forman 
a Bi. Por lo tanto, estos vectores de la base son elementos de N((T — A¡1)7). 
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Además, estos vectores son linealmente independientes puesto que forman 
un subconjunto de $;, de manera que basta con demostrar que estos vecto- 
res de la base generan a N((T — Aj1)”). 

Para cada j(j = 1, 2,... , ki), sea W; = L(S;). Como W; es T-inva- 
riante por el Ejercicio 3 de la Sección 6.1, es también (T — a;l)"-invarian- 
te. Además, de acuerdo con el Teorema 5.13, K, =W,QW,0 ---09 We, 
Si xEN((T — a¡l)”), entonces por definición x €K,,. Luego existen ele- 


mentos únicos w; EW;(j = 1, 2, ... , ki) tales que x = w, +w, +... + 
+ wx,. Por lo tanto 
0 = (T — ANG) j 


= (T — AN) + (TA) + +++ + (T — hw). 
Se tiene que 
(T — àil)” (w;) =0 para j= 1, 2,..., ki 
Supóngase para cada j que 


S, = {(T — AU), (T — ADX), o (T — A(x), xj). 
Entonces como 


W,=4 y AT — ANA UR) A + a (T — ANG) + aox; 


Para algunos escalares Apj-1)» «3 Ar, Oo, 


0=(T— Ail)” (w,) = â, -7-11 — A1)» (x) +- +a (T — Al)" (x,). 


Dado que S; es linealmente independiente, se tiene que ap-r-i Z o = 
= æ = 0. Por lo tanto 


w; =4) (1 — AN) + E — AA) x) 
+ ++ +4), AT — Ay ,). 


Esto es que w; es una combinación lineal de los vectores de la base en B; 
que están asociados con puntos en los primeros r renglones de la colum- 
na j de un diagrama de puntos para fB;, y entonces x = w, +w: +... + 
+ w;, es una combinación lineal de miembros de 8; asociados con puntos 
en los primeros r renglones de un diagrama de puntos para 8;. Conclui- 
mos que estos vectores forman una base para N((T — a¡l)”). || 


En el caso en que r= 1, el Teorema 6.6 da origen al corolario si- 
guiente. 


Corolario. Sea B; una base canónica de Jordan para la restricción de T a Ka, 
y supóngase que B, es la unión disjunta de k; ciclos de eigenvectores gene- 
ralizados correspondientes a ài. Entonces la dimensión de Er, es igual a 
k;. Por lo tanto, en una forma canónica de Jordan para T, el número de 
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bloques de Jordan correspondientes al eigenvalor A, es igual a la dimen- 
sión de E.. 


Ahora somos capaces de formular un procedimiento para calcular el 
diagrama de puntos para f; directamente a partir de T. 


Teorema 6.7. Sea r; el número de puntos en el renglón j de un diagrama de 
puntos para B;. Entonces 


(a) r, = dim(V) — rango(T — \il). 
(b) rango((T — A¡1)31) — rango((T — A:D)5) si j> 1. 


DEMOSTRACIÓN. De acuerdo con el Teorema 6.6, 


2a 
ll 


r tr + ...3+ r; = mulidad((T — A¡1)/) 
= dim(V) — rango((T — A¡1)*) para cualquier j > 1. 
Por lo tanto 
rı = dim(V) — rango((T — as!)") 
y 
ir Tr + .. + ri) r. (rn + Tr. + ... Frj) 
= (dim(V) — rango((T — as1)/)) — (dim(V) — rango((T — à;l1)i=)) 
= rango((T — ajl)71) — rango((T — A¡1)?) paraj> 1. E 
Este teorema muestra que un diagrama de puntos para 8; está comple- 


tamente determinado por T. Por lo tanto hemos demostrado el siguiente 
resultado de unicidad. 


Corolario. Para cualquier eigenvalor à; de T el diagrama de puntos para B, es 
único. Por lo tanto, sujeta a la convención de que los ciclos se encuentran 
en orden de longitud decreciente, la forma canónica de Jordan de un ope- 
rador lineal es única hasta el ordenamiento de sus eigenvalores. 


Antes de dar algunos ejemplos del uso del Teorema 6.7 definiremos 
de la manera evidente la forma canónica de Jordan para una matriz. 


Definición. Sea A una matriz de n x n con elementos de F tal que el polinomio 
característico de A (y por lo tanto de L,) se descompone en un producto 
de factores de grado 1. Entonces la forma canónica de Jordan de A se defi- 
ne como la forma canónica de Jordan del operador lineal L, en F". 


Obsérvese que si J es la forma canónica de Jordan de una matriz A, 
entonces J y A son similares. De hecho, si B = (2;, 2», ... , Zn) es una 
base canónica de Jordan para L, y Q es la matriz de n x n que tiene a 
z; como su columna j, entonces J = QAQ en virtud del Teorema 5.1. 
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En los tres ejemplos siguientes calcularemos la forma canónica de Jor- 


dan para dos matrices y un operador lineal. 
Ejemplo 5. Sea j 
2 —l O 1 
0 3 —] 
A = E 
0 1 1 0 
0 —li 0 3 


Encontraremos la forma canónica de Jordan de A y una base canónica 
de Jordan para la transformación lineal L,. El polinomio característico de 
Á es 

det(A — tl) = (t — 2)*(t — 3). 
Luego, A tiene dos eigenvalores distintos, A, = 2 y à = 3 con multiplici- 
dades respectivas 3 y 1. 

Sea f, una base canónica de Jordan para la restricción de L, para K,,. 
Como A, tiene multiplicidad 3, dim(K,,) = 3 en virtud del Teorema 6.5. 
De modo que el diagrama de puntos para 8, contiene tres puntos. Como 
antes, sea r; el número de puntos en el renglón j del diagrama. Aplicando 
el Teorema 6.7 tenemos 


0 —1 1 
o S 0 E E A 
rı = 4 — rango(A — 2/1) = 4 — rango 0 I -1 0 =4-2=2 
o —1 O 1 


r. = rango(A — 2/1) — rango((A — 21)*) === Ll: 


(En realidad, en este caso no es necesario calcular a r,. Hubiéramos podido 
deducir que r. = 1 del hecho de que r, = 2 y que el diagrama tiene tres 
puntos.) Por lo tanto, el diagrama de puntos asociado con f, es 


Así, si T; es la restricción de L4 a Ka,(i = 1, 2), debemos tener que 
2 1 

Á; = [T;];, =|0 2 

0 0 


NN O O 


Como dim(K,,) = 1, cualquier 8. para Ka, estará formada de un eigen- 
vector único que corresponde a A, = 3. Entonces 


A, = [T.]8, = (3). 
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Haciendo 8 = £f, U B», tenemos que 


ooo 


J = [Li]; = 410 4: = 


U 


y por lo tanto J es la forma canónica de Jordan para A. 

Busquemos ahora una base canónica de Jordan para T = La, para lo 
cual debemos encontrar primero una base canónica de Jordan £, para T,. 
Sabemos de los cálculos anteriores que el diagrama de puntos correspon- 
diente a 8, debe ser 


«(T — A/1x1) *X2 
«Xi 


De este diagrama vemos que debemos seleccionar a x, tal que x, EN((T — 
— \ıl)?) pero que x,£N((T — A,1)*). Como 


0 —1 0 1 0 —2 1 1 
0 1 —1 0 0 0 
A-—21= , U-2= 
0 1 —1 0 0.0 
0 —1 o 1 0 —2 1 1 
Se puede ver ahora fácilmente que 
l 0 0 
0 1 1 
oPi2plo0 
0 0 2 
es una base para N((T — A,1)?) = Ka,. De estos vectores básicos, 
0 0 
1 1 
21 Y jo 
0 2 


satisfacen la condición de no pertenecer a N((T — A,1)*). Por lo tanto 
podemos seleccionar a x, de manera que sea cualquiera de los dos vecto- 
res. Tomaremos 


0 
l 
Xx; = a 
0 
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Entonces 
—1 0 n/0 —] 
0 1 —1 01 — 
(T — 4,06x,) = (4 — 2D(x,) = = f 
—1 oji2 —1 
O —1 O 1/10 —] 


Ahora simplemente tómese a x, como un elemento de Ea, que sea lineal- 
mente independiente de 
—1 
l 


T=ADE)=|_, | 
—1 
por ejemplo, selecciónese 
1 
X, = P 
0 
0 
Así, hemos asociado la base canónica de Jordan 
—1 0 1 
—1 1 0 
B=x bla blo 
—1 0 0 
con el diagrama de puntos de la siguiente manera: 
—1 1 
—1 0 
ile 0 
—1 0 
0 
l 
2 
0 


Al lector podría preocuparle que no se haya verificado la independen- 
cia lineal de f8,. Sin embargo, debe estar seguro de que esta verificación no 
es necesaria en virtud del lema del Teorema 6.4. Dado que se seleccionó 
a x, tal que fuera linealmente independiente del vector inicial (T — A,1) (x,) 
del ciclo ((T — A,1)(x,), xı}, se deduce de este lema que 8, es lineal- 
mente independiente. 
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Cualquier eigenvector de L, que corresponda al eigenvalor A. = 3 for- 
mará la base deseada 8, para Ka, —por ejemplo, 


| 7 

0 

$, = 0 

1 

Así, 
— 1 0 1 1 
—]1 1 0 0 
= U = 

B B, B: 1 , 2 , 0 , 0 
—1 0 0 1 


es una base canónica de Jordan para L,. 
Nótese que si 


—1 O 1 1 
—}1 1 0 0 
£=1_1 20 of 
—1]1 0 0 1 
entonces J = Q 40. 
Ejemplo 6. Sea 
2 —4 2 2 
—2 0 
a 1 3 
—2 -2 3 3 
—2 —6 3 7 


De nuevo encontraremos una forma canónica de Jordan de J para A y 
una matriz Q tal que J = Q "AQ. 

El polinomio característico de A es det(A — 11) = (1 — 2)*(1 — 4)?. 
Sean A, = 2, Às = 4 y B; la base canónica de Jordan para T;, la restric- 
ción de L4 a Ka,, para i = 1, 2. 

Principiamos calculando el diagrama de puntos para f,. Sea r, el 
número de puntos en el primer renglón de este diagrama; entonces r, = 
= 4 — rango(A — 21) = 4 — 2 = 2, de modo que el diagrama de pun- 
tos para £, es 


Entonces 


Calcularemos ahora el diagrama de puntos para fB.. Como rango(A — 
— 4I) = 3, existe únicamente 4 — 3 = 1 punto en el primer renglón del 
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diagrama. Como Ka, tiene dimensión 2 (Teorema 6.5), el diagrama de 
puntos para 8 debe ser 

Oo 

\ 


A= T= (5 4) 


Entonces si 8 = f, U ßa, la forma canónica de Jordan de L, es 


Luego 


2 0:00 
0 2'00 
SSIES o a 
0 00 4 


Con el objeto de encontrar una matriz Q tal que QAQ = J, primero 
debemos encontrar una base canónica de Jordan 8 para T. El diagrama 
de puntos para 8, indica que 8, se puede escoger como cualquier conjunto 
linealmente independiente de eigenvalores de A correspondientes a A, = 2. 
Por ejemplo, 


2 0 

l 1 
B: a 0 , 2 
2 0 
será suficiente. Para fz debemos encontrar un elemento x, €K, = 
= N((L, — A21)?) tal que x,£N((L, — A21)*). Una manera para encon- 
trar dicho elemento fue utilizada en el Ejemplo 5 para seleccionar al vector 


xı. En este ejemplo ilustraremos otro método para obtener tal vector. Un 
cálculo sencillo muestra que una base para el espacio nulo de L, — Al es 


Sea 


(A— 4D) = ii 


vl 
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y tómese a x, tal que sea la preimagen de 
0 


1 
l 
l 


Para realizar esta operación debemos encontrar una solución a la ecua- 
ción matricial 


a 0 
(A — 41) b = l ; 
c 1 
d l 
esto es 
—2 —4 2 2\/a 0 
—2 —4 1 3]1b 1 
—2 —2 -1 3ļļc] | 
—2 —6 3 3/1d 1 
Puede verificarse fácilmente que 
a l 
b —1 
el |-1 
d 0 


es una solución; de esta manera tenemos 
I 
—1 
Al 
0 


Xy = 


Entonces 


Por lo tanto 


0 1 
1 — I 
2 = UL, — A2D(x 1), x1} = 1 | 
1 
0 
1 
B = B, U B, = 1 
l 


2 0 
l l 
opp2p 
2 0 


es una base canónica de Jordan para La. 
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Así, si 


N O = N 
O N - Oo 
= b ss CO 
| 
p< 


entonces J = QAQ. 


Ejemplo 7. Sea V el espacio vectorial de las funciones polinómicas sobre 
R en dos variables x e y de grado a lo más 2. (Una base para V es 
a= (1, x, y, x?, y? xy).) Considérese el mapeo T: V — V definido por 


2 
14)==$f 
(f) zl 
Por ejemplo, si f(x, y) = x + 2x? — 3xy + y, entonces 
0 
TN = — f(x, y) = 1 + 4x -— 3y. 
əx 


Encontraremos una base canónica de Jordan para T. 
Primero, obsérvese que si A = [T]e, entonces 


010000 
000200 
Je 00000 ł l 
000000 
000000 
000000 
Así, el polinomio característico de T es 

—t 1 0 0.0.0 

0-1: 0 2 0 Ọ 
det(A — tI) = det n 9 ! do: 

0 0 0-12 0. 0 
0 0 0 0 —t 0 
0 0 0 0 0 ~t 


Por lo tanto T tiene únicamente un eigenvalor (A = 0) y Ka = V. Sea £ 
cualquier base canónica de Jordan para T. Si r; es el número de puntos 
en el renglón i del diagrama de puntos para 8 entonces r, = 6 — rango(4) 
(A) =6-3=3. 
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Como 


O oooo © 
o ooo oo O 
ooo ooo © 
oO o o o o N 
Oo o o o o o 

oOo o oo Q 


0 


ra = rango(4) — rango(4*) = 3 — 1=2. Entonces dado que r,= 3, 
r, = 2 y como existen seis puntos en el diagrama, se tiene que rą = 1, por 
lo que el diagrama de puntos para $ es 


mon 


Concluimos que la forma canónica de Jordan J de T es 


01 0;00 0 
00 110.00 
¿19.9 030.00 
0 0 0:0 1;50| 
0 0 00 00 
000 000 


Buscaremos ahora una base canónica de Jordan para T. Como la pri- 
mera columna del diagrama de puntos para £ está formada por tres puntos, 
debemos encontrar un vector x, tal que 


o? 0 
gg) #0. 


Examinando la base « = (1, x, y, x”, y?, xy) para Ka, vemos que x? es un 
candidato para xı. Haciendo x, = x” encontramos que 


(TM) Gu) =T) = a) =2x y 


TAa) = PE) = 508) =2. 


De la misma manera, dado que la segunda columna del diagrama de pun- 
tos para 8 está formada por dos puntos, debemos encontrar un vector X: 
tal que 


Z) #0. 
X 
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Examinando a «æ con 1, x y x? no consideradas (porque están dentro del 


subespacio generado por el ciclo (2, 2x, x?)), vemos que podemos escoger 
X = xy. Así 


z PME: ES 
(T — Al) (x2) = T(x.) = FAY) =y. 


Finalmente, selecciónese x, = y*. Así habremos identificado la siguiente 
base con el diagrama de puntos 


.22 «y .y? 
.2x «Xy 
.x? 


Luego entonces, 8 = (2, 2x, x”, y, xy, y?) es una base canónica de Jordan 
para T. 


En los tres ejemplos anteriores aprovechamos nuestro ingenio, así como 
el contexto del problema para encontrar una base canónica de Jordan. 
El lector será capaz de realizar lo mismo en los ejercicios. Tuvimos éxito 
en estos casos por el hecho de que las dimensiones de los eigenespacios 
considerados eran pequeñas. No trataremos, sin embargo, de desarrollar 
un algoritmo general para calcular una base canónica de Jordan aun cuan- 
do se podría formular uno siguiendo los pasos de la demostración de la 
existencia de tal base (Teorema 6.4). 

El siguiente resultado puede ser considerado como un corolario del 
Teorema 6.7. 


Teorema 6.8. Sean A y B dos matrices cuadradas del mismo tamaño, cada una 
con formas canónicas de Jordan calculadas de acuerdo con las convencio- 
nes de esta sección. Entonces A y B son similares si y sólo si tienen la 
misma forma canónica de Jordan (hasta una permutación de sus eigen- 
valores). 


DEMOSTRACIÓN. Si A y B tienen la misma forma canónica de Jordan J, 
entonces A y B son ambas similares a J y por lo tanto son similares en- 
tre sí. 


Recíprocamente, supóngase que A y B son similares. Entonces A y 
B deben tener los mismos eigenvalores con las mismas multiplicidades. 
Sean J, y Ja respectivamente las formas canónicas de Jordan de A y B 
para algún orden fijo de sus eigenvalores. Entonces como A es similar a 
Jı y B es similar a J,, la hipótesis implica que J, y J, son similares. 
Por lo tanto, de acuerdo con el Ejercicio 19 de la Sección 5.1, existe un 
operador lineal T en un espacio vectorial dimensionalmente finito V, así 
como bases 8 y y para V tales que [T]g = Jı y [T]y = J}. Entonces J, 
y J, son formas canónicas de Jordan para el mismo operador lineal. Por 
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lo tanto, como los eigenvalores de A y B están ordenados en la misma 
forma, el corolario al Teorema 6.7 implica que Ja = J; MW 


Ejemplo 8. Determinaremos cuáles de las siguientes matrices son simi- 
lares. 
=3 3 -=2 0 1 —1 
A=| -7 6- =3 jf, B=|-4 4 -—2]), 
ll 2 -2 1 1 
0 —1 -i 0 1 2 
C={ -3 -1 -2) y DS{0 1 1]. 
7 5 6 0.0 2 


Obsérvese que 4, B y C tienen el mismo polinomio característico — (t — 
— 1)(1 — 2)?, mientras que D tiene a —1t(t — 1) (t — 2) como polinomio 
característico. Entonces, como matrices similares tienen los mismos poli- 
nomios característicos, D no puede ser semejante a 4, B o C. Ahora bien, 
cada una de las matrices 4, B y C tiene los mismos eigenvalores A, = 1 
y A. = 2 con multiplicidades respectivas de 1 y 2. Si Ja, Jg y Je son res- 
pectivamente las formas canónicas de Jordan de A, B y C, con respecto 
a este orden de sus eigenvalores, entonces 


1.0.0 1 0 0 1 0 O 
J¿=|0 2 1], I=|0 2 0], y J.=|0 2 1]. 
0.0 2 0 0 2 0 0 2 
A es similar a C, mientras que B no es similar ni a A 


Como Ja = Je, 
ni a C. 


El lector debería observar que cualquier matriz diagonal es una forma 
canónica de Jordan, de manera que T es diagonalizable si y sólo si su 
forma canónica de Jordan es una matriz diagonal. Por lo tanto, si T es 
un operador diagonalizable en V, cualquier base canónica de Jordan para 
T es una base para V formada por eigenvectores de T. 


EJERCICIOS 


t: 


Decir si las siguientes afirmaciones son verdaderas O falsas. 


(a) La forma canónica de Jordan de una matriz diagonal es la matriz 
misma. 

(b) Sea T un operador lineal en un espacio vectorial dimensionalmente fi- 
nito V que tiene una forma canónica de Jordan J. Si 8 es cualquier 
base para V, entonces la forma canónica de Jordan para [T] es J. 

(c) Operadores lineales con el mismo polinomio característico son simi- 
lares. 
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(d) Matrices con la misma forma canónica de Jordan son similares. 

(e) Toda matriz es similar a su forma canónica de Jordan. 

(f£) Sea T un operador lineal en un espacio vectorial dimensionalmente fi- 
nito con polinomio característico ( —1)*(t — A)”. T tiene una forma 
canónica de Jordan única, sujeto a la convención de que los bloques 
de Jordan estén ordenados por tamaños decrecientes. 

(g) Si un operador tiene una forma canónica de Jordan, entonces existe 
una base canónica de Jordan única para ese operador. 

(h) El diagrama de puntos de cualquier operador lineal que tenga una 
forma canónica de Jordan es único. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que el polinomio característico de T se descompone en un producto de 
factores de grado 1. Sean A, = 2, àz = 4 y As = —3 los distintos eigen- 
valores de T y supóngase que los diagramas de puntos para la restricción de 
T—Ajil a K1( = 1, 2, 3) son los siguientes: 


Encontrar la forma canónica de Jordan de T. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que la forma canónica de Jordan de T es 


2100000 
02 1:0000 
0.0 2'000 0 
0 0 02 1'0 0 
0 0 0i0 2100 
000003 0 
0000010 3 


(a) Encontrar el polinomio característico de T. 
(b) Encontrar el diagrama de puntos correspondiente a cada eigenvalor 


de T. 
(c) ¿Para cuáles eigenvalores A;, si es que hay alguno, se tiene que 
Ea, = Ka? 


(d) Para cada eigenvalor A; encontrar el entero positivo más pequeño p; 
para el cual Ka, = N((T — A¡1)%). 
(e) Sea U; la restricción de T — A;l a Ka, para cada i. Calcular para cada i: 


Forma canónica de Jordan 355 


(1) rango(U;) 
(ii) rango (UÑ ) 
(111) nulidad(U;) 
(iv) nulidad(U?) 


4. Para cada una de las siguientes matrices A, encontrar una forma canónica 
de Jordan J y una matriz Q tal que J = QAQ. 


(a) -3 3 —2 (b) 0 1 —i 
A=|-7 6 -3 A=|-4 4 -2 
l-1 2 2.1 1 
(c) 0 —1 -1 (d) 0-3 12 
=|-3 -1 -2 ao [2 1-12 
71 5 6 -2 1-12 
—2 —3 14 


Nótese que las matrices de los incisos (a), (b) y (c) son matrices utili- 
zadas en el Ejemplo 8. 


5. Sea A una matriz de n x n cuyo polinomio característico se descompone en 
un producto de factores de grado 1. Demostrar que A y At tienen la mis- 
ma forma canónica de Jordan y concluir que A y A! son similares. Suge- 
rencia: Para cualquier eigenvalor A de A y At y cualquier entero positivo 
r, demostrar que rango((A — Al)") = rango((A! — Al)”). 


6. Sea V el espacio vectorial de las funciones que son combinaciones lineales 
de e”, xe”, x'e" y e”. Defínase T: V— V mediante T(f) = f' (la derivada de 
f). Encontrar una forma canónica de Jordan así como una base canónica 
de Jordan para T. 


7. Supóngase que un arreglo de puntos (tales como un diagrama de puntos) 
tiene k columnas y m renglones y que la columna į del arreglo contiene p; 
puntos y el renglón ¡ del arreglo contiene r; puntos. Si p, > Pz > ... > Pz, 
demostrar las siguientes proposiciones: 


(a) m=p,yk=r,. 

(b) p, =max[j: r; > i} para 1<i<k y r;= max[j: pj>i) para 
1 < i < m. Sugerencia: Utilizar inducción sobre m. 

(c) >>... > im 

(d) Conclúyase que el número de puntos en cada columna de un dia- 
grama de puntos queda completamente determinado si se conoce el 
número de puntos en cada renglón. 


Definición. Un operador lineal T en V se llama nilpotente si T? = T, para algún 
entero positivo p. 
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Demostrar que si T es un operador nilpotente en un espacio vectorial n-di- 
mensional V, entonces el polinomio característico de T es (—1)”r". Por lo 
tanto, el polinomio característico de T se descompone en un producto de 
factores de grado 1 y T tiene únicamente un eigenvalor (cero) de multipli- 
cidad n. Sugerencia: Utilizar inducción sobre n. En el paso general, supón- 
gase que la conclusión es verdadera para todos los espacios vectoriales de 
dimensión menor que n y síganse los pasos siguientes. 


(a) Demostrar que T tiene al menos un eigenvector correspondiente a 
à= 0, Luego dim(R(T)) < dim(V) = n. 

(b) Aplicar la hipótesis de inducción al subespacio T-invariante R(T). 

(c) Extiéndase una base (x,, X=, .. , Xx) para R(T) hasta una base 8 = 
= {Xis Xa, e Ma o > Xn} para V. 


(d) Demostrar que 
_(B, B: 
[Mg Al lo o) > 


donde O y O” son, respectivamente, matrices nulas de (n— k) xk 
y (n— k) x (n-k). 
(e) Dedúzcase que det(T — 11) = (—1)”f”. 


Demostrar la recíproca del Ejercicio 8: Si T es un operador lineal en V 
que tenga a (—1)”r”, como polinomio característico, entonces T es nil- 
potente. 


Dar un ejemplo de un operador lineal T tal que T no sea nilpotente pero 
que el cero sea el único eigenvalor de T. Caracterizar a todas estas trans- 
formaciones. 


Definición. Una matriz A den x n se llama nilpotente si A” es igual a la matriz 


11. 


12. 


13. 


cero de n x n para. algún entero positivo p. 


Sea A E€ Mnn (7). Demostrar que 4” = O, donde O es la matriz nula de 
nx n, si y sólo si (La)? = To. Conclúyase que A es nilpotente si y sólo 
si L, es nilpotente. 


Demostrar que cualquier matriz triangular cuadrada con todos los elemen- 
tos de la diagonal iguales a cero es nilpotente. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que el polinomio característico de T se descomponga en un producto de 
factores de grado 1. Sean à, A», ... , Az los distintos eigenvalores de T. 
Como V=K,0K,0  @ K, podemos definir un mapeo U: V—>V 
de la siguiente manera: Para xE€V, donde x= x, tx, +... + Xy con 
x; € Ka,, defínase 


U(x) = (T Mx) + (ame) +... + (17 Al) (xx). 


14. 


15. 
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Demostrar que 


(a) U es un operador lineal. 
(b) U es nilpotente. 
(c) UT = TU. 


Sean T y U como en el Ejercicio 13. Supóngase que 8; es una base canónica 
de Jordan de la restricción de T a Ka, y sea J; la forma canónica «Je 
Jordan para esta restricción. Entonces 8 = 8, U Bz U ... U By es una base 
canónica de Jordan para T. Sean J = [Tlg y S= T — U. Demostrar los si- 
guientes incisos: 


(a) [S]g es una matriz diagonal cuyos elementos de la diagonal son idén- 
ticos a los elementos de la diagonal de J; esto es, si D = [S]g, entonces 


D= Ji; si i=j 
di 0 en cualquier otro caso. 


(b) Si M = [U]g, entonces 
ES Ji; si j=i+1 
M;i; = i 
0 en cualquier otro caso. 
(c) J=D+M. 
(d) MD = DM. 
(e) Como consecuencia de los incisos (c) y (d) existe una expansión bino- 


mial para J. Sea p el entero positivo más pequeño para el cual M? 
es igual a la matriz nula. Entonces 


Jt = D' + rD™M + Lm D DM? +... 4 

+ rDM'" + M' si r <p, 
y 
Jt =D" + rD'™M + A Doa +... 


! 
$ r! 
(r— prt 1)!{p— 1)! 
(f) Si T= La, entonces existe una matriz Q tal que A = QJO”. 
(g) Para la matriz anterior Q y para cualquier entero positivo r, A" = 


= Qro”. 


DrMr! si r >p. 


Sea T un operador lineal nilpotente en un espacio vectorial dimensionalmen- 
te finito V. Recuérdese del Ejercicio 8 que A = 0 es el único eigenvalor 
de T; por lo tanto V = Ka. Sea 8 una base canónica de Jordan para T. 
Demostrar que para cualquier entero positivo i, si suprimimos de 8 los vec- 
tores correspondientes a los últimos ¿ puntos en cada columna de un 


358 


16. 


17. 


18. 


Formas canónicas 


diagrama de puntos para 8, el conjunto resultante es una base para R(T*). 
(Si una columna del diagrama de puntos contiene menos de i puntos, todos 
los vectores asociados con esa columna serán eliminados de £.) 


Encontrar un operador lineal en un espacio vectorial dimensionalmente fi- 
nito que tenga dos bases canónicas de Jordan distintas. 


Sea T un operador lineal y sea A un eigenvalor de T. 


(a) 
(b) 


(a) 


(b) 


Demostrar que dim(K,) es la suma de las longitudes de todos los 
bloques correspondientes a A en la forma canónica de Jordan de T. 
Deducir que Er = Ka si y sólo si todos los bloques de Jordan corres- 
pondientes a A son de 1 x 1. 


Sea J el bloque de Jordan correspondiente al eigenvalor A de una ma- 
triz; entonces 


/A 1.0 0 
0 åA 1 0 
0.04 0 
fe : 
0.0.0 +++ 1 
00.0 --+ 4 


Supóngase que J es de m x m y sea N =J — Alm. Demostrar que 
N™ es la matriz nula. 


Obsérvese, como en el Ejercicio 14, que para cualquier r > m 


r= Nin + rN + A Din 
$ rr SE Cem F2) Fanya 
(m — 1)! 
r r-1 r(r — 1) r-2 psa r(r — 1) --- (r —m->+2) r=m+1 
q EA O 
r r-1 COEDS r(r — 1) --- (r —m +3) r-m+2 
0 A rÀ > À 
0 0 0 Ha Ar 


Demostrar que existe lim J” si y sólo si una de las siguientes condi- 
ciones se cumple: AS 

G) lal<l. 

(1) A=1lym= 1. 


19. 


20. 


21. 


6.3* 
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Además, demostrar que lim J” es la matriz nula si se cumple (i) y 
que es la matriz (I) si se cumple (ii). 


(c) Demostrar el Teorema 5.16. 


Para cualquier A € Max, (C) defínase || A || = max(| Ai; k 1<i jįj<n} 
Demostrar los siguientes resultados para cualesquiera A, B €Mnx (C) y 
cEc. 


(a) NAN>0y | A[|=0 si y sólo si A es la matriz nula. 
(bd) | ca l|=[c|- 1/41. 

(c) [[A+BI <A! +B]. 

(d) ¡(AB [|| <7], 4 1: Bl. 


Sean A € Ma (R) una matriz de transición y PAP = J la forma canónica 
de Jordan de A. Sea ||: || como se definió en el Ejercicio 19. 


(a) Demostrar que para todo entero positivo m, || A” || < 1. 

(b) Deducir que {|| J” ||: m=1,2,...) está acotada. 

(c) Utilizando el inciso (b) anterior y el Ejercicio 18(b), demostrar que 
cada bloque de Jordan correspondiente al eigenvalor A = 1 de A 
es de 1 x 1. 

(d) Utilizando el inciso (c), el Teorema 5.16 y el Ejercicio 18(b), demos- 
trar que lim A” existe si y sólo si A tiene la propiedad de que 


mo 


siempre que A sea un eigenvalor de A con |A|= 1, entonces A = 1. 
(e) Demostrar el Teorema 5.23(a) utilizando al inciso (c) y el Teore- 
ma 5.22. 


(Este ejercicio requiere de conocimientos acerca de series absolutamente 
convergentes.) Recuérdese de la p. 297 que si ÆA € Min(C), entonces e* 
se define como lim B,,, donde 


mo>x 


A? 
Ba = It At >+... + —. 
2! m 


Utilizar el Ejercicio 19(d) para demostrar que e! existe para cada 
A E Mna (C). 


FORMA CANONICA RACIONAL 


A lo largo de los Capítulos 5 y 6 hemos estado utilizando los eigenvalores 
y los eigenvectores en nuestro análisis sobre operadores lineales en un 
espacio vectorial dimensionalmente infinito y, como hemos visto, son 
herramientas útiles siempre y cuando el polinomio característico del ope- 
rador lineal se descomponga en un producto de factores de grado 1. Exis- 
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ten, sin embargo, operadores lineales donde éste no es el caso. En efecto, 
existen operadores lineales sin eigenvalores. Lo que debe hacerse en estos 
casos es generalizar los conceptos de eigenvalor y de eigenvector con el 
objeto de obtener teoremas estructurales para reemplazar a los que encon- 
tramos en las secciones anteriores. 

Dado un operador lineal T en un espacio vectorial dimensionalmente 
finito V con un polinomio característico f(t), podemos siempre descompo- 
ner a f(t) de manera única como un producto de potencias de distintos 
polinomios mónicos irreducibles multiplicados por (—1)”, donde n = 
= dim(V). Entonces 


HO = (DBA)... (alo y, 


donde ¿,(1) es un polinomio mónico irreducible de grado positivo, n; es 
un entero positivo (¿= 1, 2,..., k) y 9:(0) 49;(t) para i Æj. Esto 
se obtiene directamente del teorema de factorización única del Apéndice E. 
En caso de que f(t) se descomponga een un producto de factores de grado 
1, ġ:(t) = t — A; para algún eigenvalor A;(i = 1, 2,..., k). En este caso 
existe una correspondencia uno-a-uno entre el conjunto de los distintos 
elgenvalores y el conjunto de los distintos factores mónicos irreducibles 
del polinomio característico. En el caso general pueden no existir eigen- 
valores, pero los factores mónicos irreducibles siempre existen. Por esto, 
es razonable buscar teoremas estructurales basados en los factores mónicos 
irreducibles del polinomio característico en vez de en los eigenvalores y 
los eigenvectores. 

En esta sección consideraremos algunos teoremas estructurales que per- 
tenezcan a esta situación más general. Para cualquier operador lineal T 
en un espacio vectorial dimensionalmente finito V, veremos que V puede 
descomponerse como una suma directa de subespacios T-cíclicos. Además, 
imponiendo ciertos requerimientos adicionales que relacionen a los sub- 
espacios T-cíclicos en la suma con los factores mónicos irreducibles del 
polinomio característico de T, obtendremos un teorema de unicidad que 
involucra a algunas propiedades de estos subespacios T-cíclicos. Consecuen- 
temente, será posible escoger una base 8 para V con el objeto de obtener 
una matriz [T]g que sea única para T de la misma manera en que la forma 
canónica de Jordan de un operador es única para ese operador. Esta 
matriz será denominada “forma canónica racional” de T. Esta forma 
podrá utilizarse en lugar de la forma canónica de Jordan en caso de que 
el polinomio característico de T no se descomponga en un producto de 
factores de grado 1. 

En este punto, sería de mucha ayuda para el lector repasar las defini- 
ciones y las técnicas utilizadas en las Secciones 5.4 y 5.5, En particular, el 
lector debería estudiar los subespacios cíclicos y las matrices compañeras 
y observar la relación existente entre ellos. Esta relación es tan importante 
para nuestro desarrollo que deseamos recalcarla en este momento: Dado 
un Operador lineal T en un espacio vectorial dimensionalmente finito V 
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y un vector no nulo x€V, supóngase que el subespacio T-cíclico de V 
generado por x, C, tiene dimensión d > 0. Se tiene de la Sección 5.4 
que B = {x, T(x), ..., T (x)} es una base ordenada para C,. Luego 
T“(x) es una combinación de 8, digamos 


Tex) = —a xx — a T(x) — ... — ag (x) 


para escalares Únicos —Go, —đ, ..., ~a (Hemos utilizado —a; en 
vez de a; por conveniencia en la notación.) Como C, es un subespacic 
T-invariante de V, podemos considerar la restricción de T a C,, To, Como 
ya hemos visto, 


0 0 0 —as 

1 0 0 —a, 

0 1 0 —a 
[Te] = i 

0 0 l —ai-ı 


Esta matriz tiene el polinomio característico 
FO = (—1) la +at+... + agt + 1%) 


y se denomina matriz compañera de f(t). Como consecuencia del Teore- 
ma 5.32, el polinomio 


p(t) =a tatt ... + agat + i 


es el polinomio mínimo de Te,. Además, de acuerdo con el Ejercicio 14 
de la Sección 5.6, el polinomio p(t) es el T-aniquilador de x. (A propósi- 
to, es esencial para el lector realizar los Ejercicios 13 y 14 de la Sección 
5.6 porque serán necesarios para establecer algunos de los resultados de 
esta sección.) 

Considérese de nuevo el operador lineal anterior T. Supóngase que V 
se descompone en una suma directa de subespacios T-cíclicos 


V=C,0C,,0 q O Ca 
para algunos vectores no nulos x,, X., ... , xx en V, donde dim(C,,) = di 
para cada i. Si 8i = {x T(xi), -.., TU“) y PSL UB: UU... U Br 
entonces 8 es una base para V y 


[T]; = Te... Ja, D Te...)s. D E 55) Te, 


en virtud del Teorema 5.26. Nótese que [T]g es una suma directa” de 
matrices compañeras. Podemos resumir lo anterior de la manera siguiente. 


Teorema 6.9. Sea T un operador lineal en un espacio vectorial dimensionalmen- 
te finito V. Si V se puede descomponer como una suma directa de subes- 
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pacios T-cíclicos, entonces existe una base B para N tal que [T]; es una 
suma directa de matrices compañeras. 


Como enunciamos anteriormente, el objeto de esta sección es demos- 
trar que siempre se puede descomponer a V en una suma directa de sub- 
espacios T-cíclicos. Además, se demostrará que siempre es posible escoger 
cada subespacio T-cíclico C, tal que el aniquilador de x sea de la forma 
($(1) )”, donde $(1) es un factor mónico irreducible del polinomio carac- 
terístico de T y m es un entero positivo. La ventaja de esta descomposición 
es que la matriz correspondiente a una base seleccionada tal como en el 
Teorema 6.9 es esencialmente única (sujeta a ciertas convenciones que 
implican el orden de los subespacios cíclicos). 

La exposición anterior nos conduce a la definición siguiente. 


Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V y sea B una base ordenada para V. La matriz [T]; se llamará forma 
canónica racional de T si 


M =C,0C,0 OC, 


donde cada C, es la matriz compañera de un polinomio de la forma 
(—1)™((t))™", (t) es un factor mónico irreducible del polinomio carac- 
terístico de T, d es el grado de $(t) y m es un entero positivo. 


El siguiente resultado es simplemente otra forma de enunciar el Teore- 
ma 6.9 con la terminología anterior. 


Corolario. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V. Si V puede descomponerse como una suma directa de subespacios 
T-ciclicos 


V=C,0C.0 @ C, 


tales que para cada i, x, tiene un aniquilador ($i (t))™, donde i(t) es 
un factor mónico irreducible del polinomio característico de T ym; es un 
entero positivo, entonces T tiene una forma canónica racional. 


En el Teorema 6.5 vimos que si el polinomio característico de un 
operador lineal T en un espacio vectorial dimensionalmente finito V se 
descompone en un producto de factores de grado 1, entonces 


V =K, OKD OK, 


donde A,, Az, ... , Ax son los distintos eigenvalores de T. Nuestro siguiente 
resultado será semejante al del Teorema 6.5 en el caso de que el polinomio 
característico de T no se descomponga en factores de grado 1. Primero, 
sin embargo, introduciremos el análogo de los eigenespacios generaliza- 
dos de T. 
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Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con polinomio característico 


MO = (Deptt nnn (an) 
donde (t), p-(t),..., $ (t) son distintos polinomios mónicos irredu- 
cibles y n, ni, N», ... , N, son enteros positivos. Para cada i = 1, 2,...,T, 


definase 


Ko, = N((9,(1))%). 


Obsérvese que para cualquier polinomio g(t), T conmuta con g(T). 
Por lo tanto, cada Kọ, es T-invariante. Además, si p(t) es el polinomio 
mínimo de T, entonces de acuerdo con el Teorema 5.29 


P) = (KDD e AD) 


para algunos enteros m; tales que O < m; < n; para 1 <i <r. Veremos 
más adelante que, de hecho, m; > | para cada i. 


Teorema 6.10. (Teorema de la descomposición primaria.) Sea T un operador 
lineal en un espacio vectorial dimensionalmente finito N con un polinomio 
mínimo p(t) = (pr(D))”" ... (9,(1))"", donde $ (0), ..., p(t) son los 
distintos factores mónicos irreducibles de p(t). Entonces 


(a) V=K5 0... Ko.. 
(b) Para 1 <i< r el polinomio mínimo de la restricción de T a 


Ko, es (pi (t))"". 


DEMOSTRACIÓN. La demostración la haremos por inducción sobre r. Si 
r= 1, la conclusión es inmediata. Así, supóngase que el teorema ha sido 
demostrado para operadores con polinomios mínimos que tienen r — 1 
distintos factores mónicos irreducibles para algún entero r > 1. 


Sean g(t) = (a (0) y h) = (ADJ... (p,(1))”r. Entonces 
g(t) y h(t) son primos relativos. Demostraremos que V = W, Q W., don- 
de W, = N(g(T)) y W. = N(h(T)). Como g(t) y h(t) son primos rela- 
tivos existen polinomios q(t) y r(t) tales que q()g() + r(t)h(t) = 1 
donde 1 es el polinomio constante. (Véase Apéndice E.) Al sustituir T 
en la ecuación se tiene 


qa(T)h(T) + 1r(M201) =|. (4) 
Entonces v = g(T)A(T) (vw) + r(T)g(T)(v) para cada v €V. Pero 
DIDATE) = qA TA = pT) =4 MT) = 0; 


esto es, q(T)A(T) (v) EW.. Del mismo modo, r(T)g(T)(v) EW.. Luego 
vV = W, + W.. Finalmente, si wE€W, N W., entonces por la ecuación (4) 


w = I(w) = q(MA(M (0) + r(T)g(T)(w) = 0+0=0; 
y así V = W, W.. 
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Obsérvese que como T conmuta con g(T) y A(T), W, y W, son T-inva- 
riantes. Sean p,(1) y p.(t) los polinomios mínimos de T, y T,, las restric- 
ciones de T a W, y W., respectivamente. Ahora demostraremos que p,(f) = 
= g(t) y p(t) = h(t). Las definiciones de W, y W. muestran que g(T,) 
y h(T.) son ambos operadores nulos. Entonces 


ps(t) divide a g(t) y p(t) divide a A(t). (5) 


Entonces p,(t)p.(1) divide a g(1)h(1) = p(t). Pero para cualquier v €V, 
v= w, + w, para algunos w, EW, y w: € W,. Por lo tanto 


Pp (Mp M0) = p Mp TW) + p(Mp(M0r,) =0 +0 =0. 


Luego p(t), el polinomio mínimo de T, también divide a p,(t)p.(t). Como 
p(t), pi(t) y p.(t) son todos mónicos, se tiene que p(t) = p,(t)p.(1). 
Finalmente la ecuación g(t)h(1) = p,(t)p.(t), la ecuación (5) y el hecho 
de que los cuatro polinomios sean mónicos implica que p,(1) = g(t) y 
pot) = h(t). 

Aplicando la hipótesis de inducción a T. y W, tenemos que 


W, = Ko, D- O Ko» donde Ky, = N((6(T,))”9, 


y que (¢ġ:(1))™ es el polinomio mínimo de la restricción de T. a K¿,. Pero 
como N((9;(T))”:) C W., se tiene que 


Ke = N(9AT)") = NC(9.(T,))") = Kẹ, para i=2,..., r. 


Además, la restricción de T a Kẹ, es la misma que la restricción de T, 
a Kọ, (i= 2,..., r), y en consecuencia (¢;:(t))”": es el polinomio mínimo 
de la restricción de T a Kọ,- Luego entonces, como 


V=W OW, =K,0K,0 K, = K, DK, @ Ks 


la demostración está completa. MW 


Principiaremos ahora el proceso de demostrar que todo operador li- 
neal T en un espacio vectorial dimensionalmente finito V tiene, sujeto a 
ciertas convenciones, una forma canónica racional única. Principiaremos 
con el caso especial en que el polinomio característico de T sea de la 
forma +($(1))”, donde (t) es irreducible y n es un entero positivo. 
En este caso el polinomio mínimo de T es de la forma (¿(1))” para algún 
entero positivo m < n y podemos demostrar que V puede descomponerse 
en una suma directa de subespacios T-cíclicos. 


Teorema 6.11. Sea T un operador lineal en un espacio vectorial dimensional- 


mente finito V con polinomio mínimo p(t) = (g(t))”, donde p(t) es un 
polinomio mónico irreducible y m es un entero positivo. Entonces existen 
vectores no nulos Xi, X., ... , X; en V y enteros positivos M;,, M., ... , Ny 
con n; < m para cada i tales que 
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(a) VW=C,0C,0:::0C,, donde C,, es el subespacio T-cí- 
clico generado por X;. 
(b) (p(t))": es el T-aniquilador de x; para i = 1, 2,..., K. 


DEMOSTRACIÓN. La demostración se hará por inducción sobre la dimen- 
sión de V. Si dim(V) = 1, el resultado es trivial. Supóngase entonces que 
el teorema se cumple para todos los espacios vectoriales de dimensión 
menor que n, donde n > 1 es un entero, y sea dim(V) = n. 


Como el polinomio mínimo de T es p(t) = ($4(1))”, existe un vector 
no nulo x; en V tal que (g4(T))""(x,) 40. Y así el T-aniquilador de 
x; es p(t). Sea W = C,, y recuérdese que W es T-invariante. Sea 


T: V/W=>V/W 
el operador lineal inducido por T en el espacio cociente V/W. (Véase Ejer- 
cicio 13 de la Sección 5.4.) Se puede ver fácilmente que para cualquier 
polinomio g(t) el operador inducido por g(T) en V/W es 2e(M. Por lo 
tanto, si g(T) = T,, entonces g(T) = To. Así el polinomio mínimo de T 
divide a p(f) y por lo tanto la hipótesis de inducción se aplica a T y a 


V/W. En consecuencia existen subespacios T-cíclicos C», ... , Cy de V/W 
tales que 


V/W=C.B...OC 


y tales que para 2 < i < k el T-aniquilador del generador de C; es ($ (1))™ 
para algún entero positivo n; < m. 

Demostraremos que para 2 < i < k existe un vector x; en el generador 
de C; tal que el T-aniquilador de x; es (p(1))":. Sea y un elemento del 
generador de C;; entonces (H(T)” (y) € W = C,,. Luego entonces existe 
un polinomio h(t) tal que 


($ (T) (y) = AMG). (6) 


Por el hecho de que ($(1))” es el polinomio mínimo de T, se tiene de la 
ecuación (6) que 


0 = ((T))” O) = GM)" AMG). 


Ahora bien, ($(1))” es el T-aniquilador de x,. Por lo tanto (ẹ(¢))” divi- 
de a (ġ(1))"":h(t) y en consecuencia ($(1))": divide a A(t). Entonces 
(9(1))"q(1) = h(t) para algún polinomio q(t). Defínase a x; = y — 
— q(T)(x,). Entonces y — x; = q(T)(x,) €C,, = W, y así tenemos que 
x, se encuentra en el generador de C;. Se tiene de aquí que el T-aniqui- 
lador del generador de C; divide al T-aniquilador de x;. Pero también, 
por la ecuación (6), 


(MIG) = (4D) O — q(1) (x,)) 
= (p(T))" (y) — A(T) (x) =0. 


Luego el T-aniquilador de x; es igual a (p(1))”:. 
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Si el grado de (1) es d, entonces (p(f))"' tiene grado dni. Luego, 


como ($(1))": es tanto el T-aniquilador de x; como el T-aniquilador del 
generador de C;, el Teorema 5.27 y el Ejercicio 14 de la Sección 5.6 mues- 
tran que 


Bi E fX T(x), PEE Teo (x;))} 


y, = [x + W, Ñx; + W),..., Té Ux, + W)) 


son, respectivamente, bases para C, y C;. Pero como V/W=C.H... 


... Cr y U... U yx es una base para V/W. Se tiene entonces que 
BUBU... U fx es una base para V. Por lo tanto V = C, @ CG, @ 
... 0C. B 


El resultado siguiente se obtiene de manera inmediata a partir del 
teorema anterior y del corolario al Teorema 6.9. 


Corolario 1. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito. Si el polinomio característico o mínimo de T es de la forma +(ẹ(t))™ 
para algún polinomio mónico irreducible $(t) y para algún entero positivo 
m, entonces T tiene una forma canónica racional. 


Corolario 2. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con polinomio característico 


F(t) = (TDI UA ADM RADA (A (DD), 


donde (t), ġ-(t),... , ¢&(t) son los distintos factores mónicos irredu- 
cibles de f(t). Entonces, para cada 1, (p¡(t))” es el polinomio caracteris- 
tico de T,, la restricción de T a Kọ,. Por lo tanto, para cada i, Kọ, es 
no nulo y $,(t) es un factor del polinomio mínimo de T. 


DEMOSTRACIÓN. Renumerando a $,(f), d$.(1), ... , x(t) si fuera nece- 
sario, podemos suponer que el polinomio mínimo de T es 

PC) = (pp (PAD), 
donde r < k y 1 < m; < n; para cada i = 1, 2,... , r. Sea f,(f) el poli- 


nomio característico de T;. Como de acuerdo con el teorema de descompo- 
sición primaria V =K, ® K ®©  @® Ky, , entonces por el Teorema 5.25 
se tiene que f(1) = fi(Dfa(t) ... f,(1). 

Considérese cualquier i 1 <i < r, y sea d el grado de ¿;(1). Como 
el polinomio mínimo de T; es (p;(1))”: en virtud del teorema de descom- 
posición primaria, podemos concluir a partir del Corolario 1 del Teorema 
6.11 que existe una base 8 para Kọ, tal que 


T= CACO OC, 
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donde C; es la matriz compañera de (—1)""(9;(1))” para algunos ente- 
ros positivos qi. q», ... , qx. Luego, si dr- = q, + q: + ... + qu. tenemos 
que 


FO) = det(C, — 11) -det(C, — tI). +++ «det(C, — tI) = Ene ny. 
Entonces 


FO = AORO ++ FLO = SO BAD)Y" (LD), 


donde € = +1. Por lo tanto, el teorema de factorización única implica 
que r=k y d; =n; para toda i. En particular, fi() = +(9$/(0))”, 
Kọ, Æ {0} y i(t) es un factor del polinomio mínimo de T para i= l, 


A A 


Continuando con el caso especial en que el polinomio mínimo de T 
tiene la forma ($(1))” para algunos polinomios mónicos irreducibles ¿(£) 
de grado d, formularemos ahora un teorema de unicidad para la forma 
canónica racional de T. Con el objeto de formular este resultado adopta- 
remos de aquí en adelante la convención de que los vectores Xi, Xe, ... a Ma 
del Teorema 6.11 tendrán siempre sus índices de tal modo que n, > n, > 
>... >m,. Sujetos a esta convención, demostraremos que los enteros 
Ni. Aa, ..., nj son únicos. De hecho, proporcionaremos un método para 
calcular estos enteros. En este momento el lector deberá observar que la 
unicidad de los enteros n,, n., ... , nj implicará la unicidad de la forma 
canónica racional de T. De hecho, se tiene que la forma canónica racio- 
nal de T es 


COCO OC, 


donde C; es la matriz compañera de (—1)%(9(£))”:. 

Para ayudarnos en el cálculo de los enteros Mi, Re, ... , Ay EN el Teo- 
rema 6.11 (y por lo tanto, estableciendo su unicidad), introduciremos un 
nuevo diagrama de puntos correspondiente a la descomposición de V como 
una suma directa de subespacios cíclicos. A diferencia de los diagramas 
de puntos de la Sección 6.2, los diagramas que ahora consideraremos no 
corresponden a las bases para V. Sea T un operador lineal en un espacio 
vectorial dimensionalmente finito V que tiene a (p(1))” como polinomio 
mínimo para algún polinomio mónico irreducible (z) y algún entero 
positivo m. Supóngase también, al igual que en el Teorema 6.11, que 
V=C.Q... OC. para algunos vectores no nulos X, X....., Xx en V 
y que, para cada j, x; tiene al aniquilador ($(1))": para algún entero 
positivo n;. Consideremos que los índices de las x; son tales que n, > m > 
>... > mi El diagrama de puntos asociado con la descomposición ante- 
rior se define como el arreglo de puntos que consta de k columnas con n, 
puntos en la columna ¿j y ordenadas de manera que la columna i principie 
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en la parte superior y termine después de n; puntos. Luego, si k = 3. 
n, =4,n.=2 y n, = 2, el diagrama de puntos se vería como 


Si definimos a r; como el número de puntos en el renglón ¡ del diagrama 
de puntos, vemos que los números r; quedan determinados por la fórmula 
dada en el Ejercicio 7 de la Sección 6.2. Además, el conocimiento de 
los números r; para toda į nos permite calcular los enteros n,, ne, ... , My. 

El siguiente teorema nos dice que los r; pueden expresarse en términos 
de los rangos de algunos operadores, de donde se deduce que los n; son 
únicos y por ello el Teorema proporciona un algoritmo para calcularlas. 


Teorema 6.12. Sean T y r, como anteriormente. Entonces 


Tr, = 4} ldim(v) — rango($(T))|] 


1 
r; = -y Lrango((g(M))' 0) — rangol ($(T)))]  parai>1l, 


donde d es el grado de ¿(t). 


DEMOSTRACIÓN. A continuación se da un bosquejo de la demostración; 
el lector deberá justificar cada paso. 


Podemos establecer ambas situaciones simultáneamente adoptando la 
convención de que 


(9(T))' = 1 sii=0, 
Entonces para cualquier ¿> 0 
RUS) = Coman D Coman O + O Comas, 
y por lo tanto (aplicando el Ejercicio 14 de la Sección 5.6 a po (1)) 


dim(RU$(T)))) = Y din, — i). 


Así para i > l, por el Ejercicio 7 de la Sección 6.2, 


rango(($(1))?) — rango(($(T1))') =d[ Y (n, — G- 1)) — $ (n, — 1)] 


nz 4-1 n, i 


=d Y ln; = (1 = 1)) = (n, = 1)] 


H, 


=d¥ |= d(max{j: n;>i) =dr. B 


n, >i 


Forma canónica racional 369 


Corolario 1. Los enteros n;, M», ... , Dy del Teorema 6.11 son únicos. Esto es, 
con la notación del Teorema 6.11, si existen vectores no nulos X’, X’, 
x’ en V y enteros positivos n', n',..., n) tales que 


...3 


V= CD CD o O Crs 


donde x' tiene como aniquilador a ($t) para i= 1, 2,..., r y n > 


1 


>n, >... 2n, entonces k= r, n = n4, n, = N$, ja Me 


Corolario 2. Sea T como en el Teorema 6.11. Suponiendo que se escoge una 
base B para V como en el Teorema 6.9, entonces la forma canónica racio- 
nal de T, [T]g, es única. De hecho 


M =C,0C,0 «HC, 
donde C, es la matriz compañera de (—1)"U($(D)"(G=1,2,..., K). 


Ahora definamos la forma canónica racional de una matriz de la ma- 
nera natural. 


Definición. La forma canónica racional de A € Max (F) se define como la for- 
ma canónica racional del operador lineal Li: F" — P”. 


Ejemplo 9. Considérese la matriz real A de 4 x 4 definida mediante 


0 =1 52 
1 =; 

To Goa 
0 03 -2 
0 0 5 —3 


Calcularemos la forma canónica racional de A. El polinomio caracte- 
rístico de A es 


=t —1l 5 —3 
l1 —t 0 — l] 
t) = det = (t? 1}. 
KO e oae ead e 
0 0 5 —3—t 


Así, en nuestra notación anterior, $(1) = 4 + 1 y d = 2. En el diagrama 
de puntos para A tenemos 


rı = ¿[dim(R*) — rango(9(4))] = 4(4 — 0) = 2 


ri = 3[rango((9(4))') — rango((9(4))1)] = +(0— 0) =0 


para i > 1. Luego, el diagrama de puntos para A es 
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Concluimos que n, = 1 y n, = 1. Obsérvese que el número de puntos 
en el diagrama de puntos es (1/d)dim(V). (En este caso dim(V) = 4 y 
d = 2.) Por lo tanto existen vectores x, y x, en R! tales que Rt = G,, DCE: 


y Xı y x. tienen ambas a p(1) = P + 1 como aniquilador. Dado que la 
matriz compañera correspondiente a f + l es 


(1 0) 


concluimos que la forma canónica racional de A es 


00 o 0 
1 oto 0 
0 0/0 —1 
o oil 0 


Ejemplo 10. Sea 4 la matriz real de 4 x 4 


2 100 

0210 

0 0 2 Oj: 

0002 
Nuevamente calcularemos la forma canónica racional de A. Nótese que A 
es una forma canónica de Jordan. Como veremos más adelante, la forma 
canónica racional de A difiere de su forma canónica de Jordan. Puede verse 
fácilmente que el polinomio característico f(t) de A es f(t) = (1— 2)4. 
Así, p(1) = 1 - 2 y d = 1. Ahora bien, 


rı = 4 — rango(9(4)) =- 4-2=2, 
r, =- rango(9(A)) = rango((9(4))*) +-2- 1-1, 


r, = rango((p(A))*) — rango((p(4))') = 1 -0= 1. 


Dado que hay 4 -- dim(V)/d puntos en el diagrama de puntos, podemos 
terminar el cálculo con r,, y el diagrama de puntos para A es 


Concluimos que n, = 3 y n, = l. Así tenemos que existen elementos x, 
y x. en R' tales que Rt = C., @ Ca, X, tiene como aniquilador a (t — 2)* y 
x. tiene como aniquilador a f -- 2. Como la matriz compañera de (= 
pE 2) 
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es 
0 0 8 
C,=ņ{1 0 —12 
O 1 6 


y la matriz compañera de (--1)(t — 2) es C, = (2), la forma canónica 
racional de A es 


0 0 8:30 
1 0 -12:0 
C=sCOE E al 
A 6;0 
0 0 0:2 


Ejemplo 11. Para las matrices A y C del Ejemplo 10, encontraremos 
una matriz Q tal que QAQ = C. 

Obsérvese que A y C son similares por el corolario del Teorema 2.27. 
Por lo tanto, únicamente tenemos que encontrar una base ordenada £8 
para R* tal que [L4] = C y luego tomar a Q como la matriz cuyas colum- 
nas son los miembros de 8. Para encontrar tal base 8, necesitamos encon- 
trar vectores no nulos x, y x, en R* tales que x, tiene a (1 — 2)* como 
aniquilador, x, tiene a (1 — 2) como aniquilador y (x,, La(x1), La(x,), 
x.) es linealmente independiente. Para empezar, encontremos un elemento 
de Rt con aniquilador (t — 2)?, esto es, un elemento x, tal que (Li — 
—21)*(x,) = 0 pero (La — 21)*(x,) +0. Si consideramos metódicamente 
a los miembros de la base estándar (e,, e., es, e,), vemos que e; tiene esta 
propiedad. Haciendo 


Xx; = e; = 


encontramos que 


Lax) = 


OQ Wo 
< 
= 
APR 
kaj 
N” 
| 


A continuación escogemos un elemento x. €R* linealmente independiente 
de (x,, La(xı), La:(x1)) y con aniquilador t — 2. Es evidente que e, satis- 
face esta condición. Así, 

0 0 1 0 
0 1 4 0 
1pl2p14fP 10 
0 0 0 l 
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es una base para R* tal que [L;i] = C. Por lo tanto, si 


Q = 


O oso 


C 
0 
1 

2 
0 


OS hh A — 
== OOO Q 


entonces QAQ = C. 


Consideraremos ahora el caso general de un operador lineal T en un 
espacio vectorial dimensionalmente finito para el que el polinomio carac- 
terístico contiene más de un factor irreducible. Combinando los Teoremas 
6.11 y 5.26 podemos demostrar fácilmente que T tiene una forma canónica 
racional. 


Teorema 6.13. Sea T cualquier operador lineal en un espacio vectorial dimen- 


sionalmente finito V. Entonces T tiene una forma canónica racional. 


DEMOSTRACIÓN. Supóngase que el polinomio característico de T es 


PMC OD CODA 


donde m; > 1 y los $¡(£)'s son polinomios mónicos irreducibles distintos. 
Si r = 1 el resultado se sigue del Corolario 1 del Teorema 6.11. De lo 
contrario, para cada i = 1, 2,..., r, Ta, la restricción de T a Kọ, tiene, 
de acuerdo con el Corolario 2 del Teorema 6.11, el polinomio característico 
+(9;(1))":. Por lo tanto, de acuerdo con el Corolario 1 del Teorema 
6.11, existe una base 8; tal que [T;]s, = D; es una forma canónica ra- 
cional para T;. Haciendo 6 = 6, U B-U ... U Bae es evidente por el Teo- 
rema 6.10 que 8 es una base para V, de modo que por el Teorema 5.26 


(M1, =20,0D,0 -::0D,. 


Así tenemos que [T]g es una forma canónica racional para T. W 


La demostración del teorema anterior implica la selección de una 
base para V que garantice una forma canónica racional para T. Dentro del 
contexto de este resultado podemos enunciar lo siguiente: Si D = [T]g es 
la forma canónica racional arriba construida, entonces D = D, Q D. @ 
BH... QD., y para cada i = 1, 2,... , r existe una sucesión de enteros 
Ma S Ma Dee > >1 tales que 


D, = Ca D Cu O E D Ciro 


donde C;; es la matriz compañera de (—1)"*(H(t)" y d; es el grado 
de p; (t). 

El teorema siguiente garantiza la unicidad de la forma canónica racio- 
nal de un operador, siempre que éste satisfaga la descripción anterior. 
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Teorema 6.14. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V con polinomio característico 


IDE AIR AID IDA 


donde los p¡(t) son polinomios mónicos irreducibles distintos y m; > 1 
para toda i. Supóngase que D es una forma canónica racional para T tal 
que D= DOD,- OD, y para cada i = 1, 2,..., r existe una 
sucesión de enteros N ¡> M2 >: ngl tales que D, =C i QC 
D... OC, donde Ci; es la matriz compañera de (—1)(4,(t)) y d; 
es el grado de ¿;(t). Entonces D es única en el sentido de que si D' es 
cualquier otra forma canónica racional para T que satisfaga la descripción 
anterior para sucesiones de enteros ni > na > +++ > nk > 1, entonces 
D= P. 

DEMOSTRACIÓN. Dado D= D, ® D⁄,® ---@® D, sea B una base para 
V tal que [T] = D. Supóngase para cada i: 1, 2,..., r que D; es una 
matriz de p; x pi. Sean 8, el conjunto ordenado consistente de los prime- 
ros p, miembros de £8, 8. el conjunto ordenado formado por los siguientes 
p: miembros de £, y así sucesivamente. Para cada ¡ -= 1,2, ... ,r defínase 
W; como el subespacio generado por 8;. En virtud del hecho de que D 
es una suma directa de las D;, W, es-un subespacio T-invariante de V y 
[Tw], = D, Como el polinomio característico de D; es un producto de 
polinomios característicos de las matrices compañeras C;;, D; debe tener 
un polinomio característico +(¢;(t))”:. Por lo tanto también lo debe 
tener Tw,. Así, por el teorema de Cayley-Hamilton, ($,(T))""(x) = 0 
para toda x€W;, de manera que W; C Kọ, y por lo tanto 


dim(W;) < dim(Kgs,) para i— l, 2,..., F. (7) 
Como 
B=U B: y BLOBS para i Æj, 
tenemos que V= W, Wa- W, Por lo tanto 
dim(V) — S dim(W.). (8) 


1 
Pero por el teorema de descomposición primaria tenemos también que 
dim(V) = Y dim(Kọ,). (9) 
i ol 


Luego, por las ecuaciones (7), (8) y (9), concluimos que dim(W;) = 
-- dim(Ky, ) para toda i. Así W; = Kg, para cada į y por lo tanto ŝi; 
es una base para Kg (i= 1, 2,..., r). De aquí que 


D:= dz, 
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es una forma canónica racional para T;, la restricción de T a Kg,. Pero, 
de acuerdo con el Corolario 2 del Teorema 6.12, D; es única y se tiene 
la unicidad de D = D,89D,09---0D,. u 


Ejemplo 12. Encontraremos la forma canónica racional de la matriz 
real 


2 0 —6 2 

I1 —2 0 0 2 
A=|1 0 1 -—3 2]. 

1-2 1 -—1 2 

I —4 3 —3 4 


Si f(t) es el polinomio característico de A, entonces puede demostrarse 
que f(t) = — (P + 2)*(1 — 2). 

Así, (1) = P +2 y (1) = t — 2 son los distintos factores mónicos 
irreducibles de f(t). Sean T = La y T; la restricción de T a Kp,. Entonces 
los polinomios característicos respectivos de T, y T. son, por el Corola- 
rio 2 del Teorema 6.11 (£ + 2)? y —(t — 2), respectivamente. Por tanto 
dim(K¢,) = 4 y dim(Kẹ,) = 1. Como la forma canónica racional de T 
es la suma directa de las formas canónicas racionales de T, y T., es nece- 
sario calcular cada una de éstas. 

Para encontrar la forma canónica racional de T,, debemos aplicar el 
Teorema 6.12 a T,. Pero de acuerdo con el Ejercicio 13 podemos, en vez 
de ello, aplicar el Teorema 6.12 directamente a T: RR". Primero, sin 
embargo, obsérvese que el número de puntos en el diagrama de puntos 
para T, es (1/d)dim(Ky4,) = 3(4) = 2, donde d es el grado de ¢,(t). 
Denotando por'r, al número de puntos en el primer renglón del diagrama 
de puntos para T,, el Ejercicio 13 nos muestra que 


r, = 3[dim(R”) — rango($,(T))] 
= 3[5 — rango(A? + 21)] 


00.0 0 0 
00 6 -12 6 
=4 S [rango |0 0 6 —12 6|| =1(5- 1)=2. 
00 6 -12 6 
0.0 12 -24 12 


Tenemos entonces que el primer renglón contiene todos los puntos del dia- 
grama de puntos para T,; esto es, el diagrama de puntos para T, es 


Concluimos que n, = n, = 1. Así, si D, es la forma canónica racional de 
T,, entonces 
D, = Ca B Ciz, 
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donde 


Por lo tanto 


0 —2/0 0 
l i 

D, = E o e 
(0) 0:0 —2 
0 011 0 


La situación para T, es trivial. Como dim(Ky,) = 1, el diagrama de 
puntos contiene únicamente un punto. Así si D, es la forma canónica 


racional para T., entonces D., = (2) y la forma canónica racional de 
A es 
0 -2 ¡0 0 0 
1 0:0 0 0 
D=D,9D,=|0 0/0 -2:0|. 
o 01 0/0 


0 0 0 012 


El lector deberá darse cuenta de que si hubiéramos escrito f(t) = — 
—= (1 — 2)(4* + 2)? y hecho a p(t) = —(1- 2) y a qa(1) = A +2, 
entonces nuestro cálculo de la forma canónica racional de A hubiera dado 


210 0 0 0 


0 0 0:1 0 


Cualquiera de las formas de D es aceptable. Nótese que, excepto por la 
permutación de $,(1) y ¢:(t), D es única. 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) La forma canónica racional de un operador lineal es la suma directa 
de matrices compañeras. 

(b) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito V y 8 es una base para V tal que [T]¿ sea la suma directa de 
matrices compañeras, entonces [T]; es una forma canónica racional 
para T. 
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(c) Existen matrices cuadradas que no tienen forma canónica racional. 

(d) Una matriz cuadrada es similar a su forma canónica racional. 

(e) La forma canónica de Jordan y la forma canónica racional de cual- 
quier operador lineal son las mismas. 

(f) Para cualquier operador lineal T en un espacio vectorial dimensio- 
nalmente finito V, cualquier factor irreducible del polinomio caracte- 
rístico de T divide al polinomio mínimo de T. 

(g) Sea (£) un divisor mónico irreducible del polinomio característico de 
un operador lineal T. Los puntos del diagrama de puntos utilizado para 
calcular la forma canónica racional de Tk. corresponden uno-a-uno 
con los vectores de una base para Kọ. 


2. Para cada una de las siguientes matrices encontrar la forma canónica ra- 
cional. 
(a) La matriz real 


Aa 

ll 
O © w 
O U = 
UY = O 


(b) La matriz real 


(c) La matriz compleja 


(d) La matriz real 


O —7 14 -6 

Il —4 6 —3 
A 

0 —4 9 —4 

O —4 I1 —5 

(e) La matriz real 

O —4 12 -—7 

l —1 3 -—3 
Az 

0 —1 6 -4 

0 -—1 8 —5 


3. Demostrar que si T es un operador lineal en un espacio vectorial dimensio- 
nalmente finito V de polinomio mínimo ($(t))” para algún entero positivo 
m, entonces N(($(T))""*) es un subespacio T-invariante propio de V. 


4. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
de polinomio característico f(t) = ( AURA BAD EM), 


10. 


11. 


12. 
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donde los ¢;(t)’s son polinomios mónicos distintos irreducibles, m; es un 
entero positivo para cada i y n = dim(V). Demostrar que para cualquier 
¡=1,2,...,r, sid; es el grado de $ ¡(t), entonces dim(Ky,) = mdi. 


Sea T como en el Ejercicio 4. Considérese cualesquiera i y j tales que i 4]. 
Demostrar que la restricción de ;(T) a Kọ, es uno-a-uno y sobreyectiva. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
de polinomio mínimo (¢(t))” para algún polinomio mónico irreducible (t) 
y para algún entero positivo m. Demostrar que la restricción de T a R(ġ(T)) 
tiene como polinomio mínimo a (p(1))"”. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demostrar que la forma canónica racional de T es una matriz diagonal si 
y sólo si T es diagonalizable. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
de polinomio característico f(t) = (—1)"9,(0 9. (£), donde p(t) y p2(1) 
son polinomios mónicos irreducibles distintos y n = dim(V). 


(a) Demostrar que existen elementos x, y X: en V tales que x, tiene 
como T-aniquilador a ¿,(£), x. tiene como T-aniquilador a (t) y 


V = Cr, O Cr, - 


(b) Demostrar que existe un elemento x, en V con T-aniquilador ¿, (1) $2(1) 
para el que V = Cz. 


Así, para asegurarnos que la descomposición de V en una suma directa 
de subespacios cíclicos es única, debemos exigir que los generadores de los 
subespacios cíclicos en la suma tengan las potencias de los factores mónicos 
irreducibles del polinomio característico iguales a las de sus T-aniquiladores. 


En la notación del Teorema 6.11, demostrar que los índices de las x; son 
tales que n, > nm: >... > Mx, entonces n; = m. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Suponiendo que la notación es la misma del enunciado del Teorema 6.14, 
demostrar que el polinomio mínimo de T es 


P = (p (Cp o Ar). 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demostrar que para cualquier polinomio irreducible (t), si p(T) no es 
uno-a-uno en V, entonces ¿(1) divide al polinomio característico de T. 
Sugerencia: Utilizar el Ejercicio 14 de la Sección 5.6. 


Justificar la siguiente observación hecha en el Ejemplo 9: Si T es un opera- 
dor lineal en un espacio vectorial dimensionalmente finito V de polinomio 
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mínimo (g(1))”, donde ¿(1) es irreducible, mónico y de grado d, entonces 
el número de puntos del diagrama de puntos para T es dim(V) /d. 


13. Justificar la aplicación del Teorema 6.12 en el Ejemplo 12; esto es, demos- 
trar el siguiente resultado: Sea T un operador lineal en un espacio vectorial 
dimensionalmente finito V de polinomio característico 


HO = EDAD)... (6 (0 )”, 


donde los ¿;(t) son los distintos factores mónicos irreducibles de f(D), m; 
es un entero positivo (i = 1, 2,...,r) y n= dim(V). Entonces para cual- 
quier i = 1, 2,..., r 
dim(V) — rango ($(T)) = dim(K,,) — rango (H(Tk,,)), 

y para cualquier entero j > 1 
rango ((PT)y"*) — rango (($T)") = rango (($Tk,)"71) — rango (($(Tk,,))"). 
Luego si r; es el número de elementos del renglón j del diagrama de puntos 
para Tx, entonces 

1 
d 


ri = 


[dim(V) — rango($;(T))1, 
y 
r; = Arango (($s(1))4>) — rango(($;(T1))?)] para j> 1, 


en donde d es el grado de g;(1). 
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Capítulo 7 


Espacios con producto 
interior 


7.1 


Muchas de las aplicaciones de las matemáticas están involucradas con el 
concepto de medición y, por lo tanto, con el de magnitud o tamaño rela- 
tivo de diversas cantidades. Luego, no es sorprendente de que los campos 
de los números reales y los complejos que contienen una noción intrínse- 
ca de distancia jueguen un papel especial. En este capítulo, considerare- 
mos que todos nuestros espacios vectoriales se encuentran sobre el campo 
F, donde F representa a R o a C. 

Introduciremos la idea de distancia o longitud en los espacios vecto- 
riales obteniendo una estructura mucho más rica, la famosa “estructura 
de espacio con producto interior”. Esta estructura adicional proporcionará 
aplicaciones a la geometría (Sección 7.8), a la física (Sección 7.4), condi- 
cionamiento en los sistemas de ecuaciones (Sección 7.6), aplicaciones a 
los mínimos cuadrados (Sección 7.10) y formas cuadráticas (Sección 
7.11). 


PRODUCTOS INTERIORES Y NORMAS 


Muchas de las nociones geométricas tales como ángulo, longitud y perpen- 
dicularidad en R? y R? pueden extenderse a espacios vectoriales reales y 
complejos más generales. Todas estas ideas están relacionadas con el con- 
cepto de “producto interior”. 


Definición. Sea V un espacio vectorial sobre F. Un producto interior en V es 


una función que asigna a cada par ordenado de vectores x y y en V un esca- 
lar en F, representado como (x, y), tal que para toda x, y y z en V y toda 
c en F se tiene que: 


(a) (x+z, y) = (x,y) + (z, y). 

(b) (cx, y) = c(x, y). 

(c) (x,y) = (y, x), donde la barra indica conjugación compleja. 
(d) (xx) >0six>Z%0. 
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Nótese que (c) se reduce a (x, y) = (y, x) si F= R. Las condiciones 
(a) y (b) simplemente requieren que el producto interior sea lineal en la 
primera componente. 

Se puede comprobar fácilmente que si a, ... , ap EF y y, Xi, Xa ..., 
Xn EV, entonces 

( Y aixi, y) = Y a(x y). 

i-1 i=1 
Ejemplo 1. Sea V = F. Para x= (a... , aa) y y = (b,, ..., b,) de- 
fínase 

(x, y) = Dabi. 
i=1 

(., .) satisface las condiciones de la (a) a la (d) y se denomina producto 
interior ordinario en F". (En cursos elementales de álgebra lineal, éste se 
denomina producto punto.) 

La verificación de (a) hasta (d) es sencilla. Por ejemplo, si z = (c,,..., 
Cn), tenemos para (a) 


(x+2 y“y)=2Y (a; + cb; = Sab, añ S cb, 


= (x, y) + (z, y). 


Así para x= (1+1 4) y y= (Q-— 31, 4 + Si) en CŒ? tenemos que 
(x,y) = (1+DQ+ 31) + 4(4 — 5i) = 15 — 15i. 


Ejemplo 2. Si (x, y) es un producto interior cualquiera en un espacio 
vectorial V y r > 0, podemos definir otro producto interior mediante la 
regla (x, y)! = r(x, y). Si se tuviera que r< 0 entonces (d) no se 
satisfaría. 


Ejemplo 3. Sea V = C([O, 1]) el espacio vectorial de funciones continuas 

de valor real en [0, 1]. Para f, g € V, defínase (f, g) = F OO dt. Como 
0 

la integral anterior es lineal en f, (a) y (b) son inmediatas y (c) es trivial. 

Si f +0, entonces la gráfica de f* está ubicada sobre el eje x en algún 

subintervalo de [0, 1] (aquí se utiliza la continuidad), y por lo tanto 


GD =| MOP di >0. 


Definición. Sea A una matriz de m x n con elementos de F. Definimos la 


transpuesta conjugada (o adjunta) de A como la matriz A* de n x m tal 
que (AF); = Aji. 


Ejempio 4. Sea 
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Entonces 


ppe 
ds dl 


La transpuesta conjugada de una matriz jugará un papel muy impor- 
tante en el resto de este capítulo. Nótese que si A tiene elementos reales, 
entonces A* es sencillamente la transpuesta de A. 


Ejemplo 5. Sea V = Mna (F) y defínase (A, B) = tr(B*A) para A, 
B EV. (Recuérdese que la traza de una matriz A se define también como 


tr(4) = $ Aii.) Verificaremos que los incisos (a) y (d) de la definición 


isl 
de producto interior se satisfacen y dejaremos los incisos (b) y (c) al 
lector. Para ello, sea 4, B, C €V. Entonces (utilizando el Ejercicio 6 de 
la Sección 1.3) (A + B, C) =tr(C*(A + B)) =-tr(C*A + C*B) = 
= tr(C*A) + tr(C*B) = (A, C) + (B, C). También 


(A, A) =trCAFA) = X (A*A): = D DO (APO) An 
d=1 i ik 1 


n 


=N DN Andi = Y YN Axil? 
ù- z è Ik 1 


Por lo tanto, si A -4 O, entonces Ay; Y: 0 para algunas k e i. Así (A, A) >0. 

Un espacio vectorial V sobre F dotado con un producto interior espe- 
cífico se llama espacio con producto interior. Si F- C, llamamos a V' 
espacio complejo con producto interior, mientras que si F -= R, llamamos 
a V espacio real con producto interior. 

Así, los Ejemplos 1, 3 y 5 también proporcionan ejemplos de espacios 
con producto interior. Para el resto de este capítulo, F" será el espacio con 
producto interior con el producto interior dado en el Ejemplo 1. 

El lector deberá tener la precaución de que dos distintos productos inte- 
riores en un espacio vectorial dado, arrojan dos distintos espacios del 
producto interior. 

Un espacio del producto interior muy importante que se parece a 
C([0, 1]) es el espacio H de funciones continuas de valor complejo defini- 
das en el intervalo [0, 27] con el producto interior 


Mare f "Og dt. 


2 1 ds ; . 
La razón de la constante z- Será evidente posteriormente. Este espacio 


da 


del producto interior, que surge a menudo dentro del contexto de situa- 
ciones de tipo físico, será examinado más detenidamente en secciones pos- 
teriores. 
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En este momento mencionaremos algunas cuestiones sobre la integra- 
ción de funciones de valor complejo. Primero, el número imaginario i 
puede ser considerado como una constante bajo el signo de integración. 
Segundo, toda función de valor complejo f puede escribirse como f = fı + 
+ ifa, donde f, y f. son funciones de valor real. 

Entonces tenemos que 


fis fife» Ji fr 


De estas propiedades, así como de la suposición de continuidad, se 
tiene que H es un espacio con producto interior. 

Algunas propiedades que se derivan de inmediato de la definición de 
un producto interior están contenidas en el siguiente teorema. 


Teorema 7.1. Sea V un espacio con producto interior. Entonces para x, y, z €V 


y cEF 


(a) (x,y +2) = (x,y) + (x, z). 

(b) (x, cy) = T(x, y). 

(c) (x,x) =0 si y sólo si x = 0. 

(d) Si (x, y) = (x, z) para toda x €V, entonces y = z. 


DEMOSTRACIÓN. 
(a) (x, y+ z) = (y+z, x)= 0, x) + (z, x) 
= (y, x) + (z, x) = (x, y) + (x, 2). 


Las demostraciones de (b), (c) y (d) se dejan como ejercicios. M 


El lector deberá observar que los incisos (a) y (b) del Teorema 7.1 
muestran que el producto interior es lineal conjugado en la segunda com- 
ponente. 

Con el objeto de generalizar la noción de longitud en R? para espacios 
con producto interior cualesquiera, necesitamos observar únicamente que 
la longitud de x = (a, b, c) €R? está dada por Va? + b? + œ = y (x, x). 
Por lo tanto, damos la siguiente definición. 


Definición. Sea V un espacio con producto interior. Para x €V definimos la 


norma (o longitud) de x mediante || x || = V (x, x). 
Ejemplo 6. Sea V = F”. Entonces 


|Í Ca, EEG an) || = [3 | a; j i 


es la definición Euclidiana de longitud. Nótese que si n = 1, tenemos que 
lal|= lal. 
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Como sería de esperarse, las conocidas propiedades de la longitud en 
R* se satisfacen en general, como se demostrará más adelante. 


Teorema 7.2. Sea V un espacio con producto interior. Entonces para toda x, 
y EV y cEF tenemos 


(a) [cx] = [ef [1x[]. 

x|| =0 si y sólo si x= 0. En cualquier caso ||x|| > 0. 
(c) (Desigualdad de Cauchy-Schwarz) |(x, y)| < ||x]| - |lyl]. 
(d) (Desigualdad del triángulo) ||x + y|| < ||x|| + |ly]!. 


DEMOSTRACIÓN. Dejaremos la demostración de (a) y (b) como ejerci- 
cios. 


(c) Si y = O, entonces el resultado es inmediato. Así, supóngase que 
y +0. Entonces, para cualquier c € F, tenemos que 


0 < ||x = cyļ|? = (x= cy, x — cy) = (x, x — cy) — ely, x — cy) 
= (x, x) — E(x, y) — e(y, x) + (y, y). 
Haciendo 
6, y) 
5 (y, y)” 
la desigualdad anterior será 
[Go y) a |x, y) 
SERCE E AEE 
A a A 


de donde se obtiene (c). 


(d) Ilx + yl =œ +y xH lIla Ho HH Ooy) 
=|| xP + 2 Re(x, y) + Ily 11? 
<llxlP + 216, y+ Ily I 
< IlxIP + 2iixlly 11 + iyl 
= (lx 11 + 119102, 


donde Re(x, y) es la parte real del número complejo (x, y). Nótese que 
utilizamos al inciso (c) para demostrar (d). MW 


El caso en que se da la igualdad en (c) y (d) se considera en el 
Ejercicio 15. 


Ejemplo 7. Para V = F" podemos emplear (c) y (d) en el producto inte- 
rior ordinario para obtener las siguientes muy conocidas desigualdades 


DS a;b; | < [3 lp] z eie] 


7 
13 
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È a, + b; T < È a+ È lb, >. 


El lector podrá recordar de cursos anteriores que para V = R? o R? 
tenemos que (x, y) = ¡ix]| | y!| cos 9 donde 6 es el ángulo (0 < 0 < 7) 
entre x e y. Esta ecuación implica a (c) de un modo inmediato puesto 
que ¡cos 6| < 1. Nótese igualmente que x e y son perpendiculares si y sólo 
si cos Y = 0, esto es, si y sólo si (x, y) = 0. 

Estamos en el momento de poder generalizar la noción de perpendicu- 
laridad para espacios con producto interior cualesquiera. 


Definiciones. Sea V un espacio con producto interior. Un vector x en V es un 


vector unitario si |x|! =- 1. Los vectores x y y son ortogonales (perpen- 
diculares) si (x, y) + 0. Un subconjunto S de N es ortogonal si cualquier 
par de elementos distintos de S es ortogonal. Finalmente un subconjunto 
S de V es ortonormal si S es ortogonal y está formado únicamente de 
vectores unitarios. 


Nótese que si S: {xn X2 ..., Xx»), entonces S es ortonormal si y 
sólo si (xi, x;) + 8;;, donde 8;; es la delta de Kronecker. Obsérvese tam- 
bién que para cualquier vector no nulo x, (1/1/x/])x es un vector unitario. 


Ejemplo 8. El conjunto S= ((1, 1), (1, —1)) en F? es ortogonal pero 
no ortonormal; sin embargo 


s= (7 v3) (7 72)! 


Ejemplo 9. Recuérdese a H (ver la pág. 381). Proporcionaremos un 
ejemplo muy importante de un subconjunto ortonormal de H al cual regre- 
saremos en ejemplos posteriores. Defínase a $= (e'/": j es un entero), 
donde į es el número imaginario Y —1. Claramente S es un subconjunto 
de H. (Recuérdese que e'i" = cos jx + isen jx.) Utilizando la propie- 
dad de que e'! = e`! para cualquier número real ft, tenemos para j- k 
que 


es ortonormal. 


2 27 
o; a l o l L 
(er, ex) == > ete dt == 57 exit dt 
TT 
0 0 


l [2x 
ei iEn 


2 k) 
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También tenemos que 


27 27 


ela Le 1 cesa 1 
(ee) => f e Ya | dt=1 
27 2 


En otras palabras (e e )= 8, 


. . . 2 3 z . . 

Si consideramos a los espacios R^ y R?, es geométricamente evidente que 
los conjuntos ortogonales de vectores no nulos son linealmente independientes. El 
teorema siguiente nos dice que esto es cierto en cualquier espacio con producto 
interior. 


Teorema 7.3. Sea V un espacio con producto interior, y sea S un conjunto ortogonal 
formado por vectores no nulos. Entonces S es linealmente independiente. 


DEMOSTRACIÓN. Sean Xy, X2, ..., Xn, elementos distintos en S y supóngase que 


n 
0 = > a;X; 
i=1 


Entonces para cualquier j, 1 <j<n. 


0-(0.5)= $ (axx) -Xa (xx) =af l 


i=1 i=1 


Puesto que (xx; )=0 para i + j, Como x % 0, tenemos que aj = 0. Por lo 


tanto, S es linealmente independiente. 


Este teorema nos dice, por ejemplo, que el espacio vectorial H del Ejemplo 
9 contiene un conjunto independiente infinito y por lo tanto no es un espacio 
vectorial dimensionalmente finito. 


EJERCICIOS 
1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Un producto interior es una función de valor escalar dentro del conjunto de 
pares ordenados de vectores. 

(b) Un espacio con producto interior debe estar sobre el campo de los números 
reales o complejos. 

(c) Un producto interior es lineal en ambas componentes. 


(d) Existe exactamente un producto interior en el espacio vectorial R”. La 
desigualdad del triángulo sólo se cumple para espacios con producto 
interior dimensionalmente finitos. 

(e) La desigualdad del triangulo sólo se cumple para espacios con producto 
interior dimensionalmente finitos. 

(f) Todo conjunto ortogonal es linealmente independiente. 

(g) Todo conjunto ortonormal es linealmente independiente. 
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(h) Unicamente las matrices cuadradas tienen una transpuesta conjugada. 
(i) Si (x, y) = 0 para toda x en un espacio con producto interior, enton- 
ces y = 0. 


Sea V = C? con el producto interior ordinario. Sean x = (2, 1 +11) y 
y= (21,2, 1 +21). Calcular (x, y), |lx!l, iyi] y lx + y!!?. Luego veri- 
ficar tanto la desigualdad de Cauchy como la del triángulo. 


En C([0, 1]) sea (1) = t y g(t) = e'. Calcular (f, g) (tal como se definió 
en el Ejemplo 3), |[fll, llg!] y [If + gl!. Luego verificar la desigualdad de 
Cauchy y la del triángulo. 


Sea V = Mapa (F) con (4, B) = tr(B*A). Completar la demostración del 
Ejemplo 5 de que (., .) es un producto interior. Si n == 2 y 


oyi 2+i _(1+i 0 
A= (> pe e 20) 


calcular |!4!!, ¡Bl y (4, B). 


Demostrar que (x, y) = xAy* es un producto interior en C?, donde 


(1. i 
A = e > 
Calcular (x, y) para x= (1— 1,2 + 3i) y y= (2 + 15,3 -- 21). 
Completar la demostración del Teorema 7.1. 


Completar la demostración del Teorema 7.2. 


Dar razones por las cuales cada uno de los siguientes incisos no son pro- 
ductos interiores en los espacios vectoriales dados. 


(a) (Ca, b), (c, d)) = ac — bd en R: 

(b) (4, B) = tr(A + B) en Mae(R) 

(c) (f,g)= f FOg( de en P(R), donde ’ denota diferenciación. 
Sea 8 una base para un espacio con producto interior dimensionalmente fi- 
nito. Demostrar que si (x, y) = O para toda x €ß, entonces y = 0. 


Sea V un espacio con producto interior, supóngase que x y y son elementos 
ortogonales de V. Demostrar que ||x + y|'? = ||xl|* + !y]l2. Deducir el teo- 
rema de Pitágoras para R?. 


Demostrar la ley del paralelogramo en un espacio con producto interior V; 
esto es, demostrar que 


lx + yl? + Ilx — yi? = 2ilx]? + 2]]y]? para toda x, y EV. 


¿Qué expresa esta ecuación con respecto a paralelogramos en R?? 
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12.* Sea (x,,... , Xx} un conjunto ortogonal en V y sean a,, ... , ax EF. De- 


13. 


14. 


15. 


16. 


19. 


mostrar que 


[Sax |" = S atii. 


Supóngase que (., .), y (., .). son dos productos interiores en un espacio 
vectorial V. Demostrar que (., .) = (., .), + (œn .). es otro producto inte- 
rior en V. 


Sean A y B matrices de n x y sea cE€F. Demostrar que (4 + cB)* = 
= A* + CB*, 


(a) Demostrar que si V es in espacio con producto interior, entonces 


I(x, y)| = |Ix]| + ily]| si y ólo si uno de los vectores x o y es múltiplo 
del otro. Sugerencia: Si YF 0, sea 
as La y) 
Iyi] 


Entonces x = ay + z, donde (y, z) = 0. Por suposición 


la] = [lxi] 
Jl 
Aplicar el Ejercicio 10 a [|x|]? = [lay + z||? y obténgase ||z|| = 0. 
(b) Obtener un resultado semejante para la igualdad ||x + y|] = ||x|] + 


+ |iyl! y generalizarla para el caso de n vectores. 


Sea V = C([O, 11), y defínase 


(f, g) = f Dear 
0 
¿Es éste un producto interior sobre V? 


Sea V un espacio con producto interior, y supóngase que T: V— V es 
lineal y que ||T(x)|| = ||x|| para toda x. Demostrar que T es uno-a-uno. 


Sea V un espacio vectorial sobre F, donde F = R o C, y sea W un espacio 
con producto interior sobre F con un producto interior (., .). Si T: V —> W 
es lineal, demostrar que (x, y)” = (T(x), T(y)) define un producto interior 
en V si y sólo si T es uno-a-uno. 


Sea V un espacio con producto interior; demostrar que 


(a) lx = yl] = |x|? +2 Re(x, y) + !lyll? para toda x, y€V, donde 
Re(x, y) es la parte real del número complejo (x, y). 
(b) xl! — llo 11] < lx — yl] para toda x, y €V. 
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20. 


21. 


22. 


23. 
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Sea V un espacio sobre F con producto interior. Verificar las identidades 
polares. Para toda x, yEV 


(a) (x, y) = tlx +yli — dlix — ylle si F= R. 
(b) (x, y) = 45 Bl + #ylle si F= C. 


k=21 


Donde i>: y — i 
Sea A una matriz de n x n. Defínase 
A =X(4 4 4%) A. =X(4- Ar) 
1 2 y 2 — 2 . 


(a) Demostrar que 4* = A, AF = A, y A = A, + id.. ¿Sería razona- 
ble definir a A, y A. como las partes real e imaginaria, respectiva- 
mente, de la matriz A? 

(b) Sea A una matriz de n x n. Demostrar que si A = B, + iB. donde 
B* = B, y B* = B,, entonces B, = A, y B: = A.. 


Sea V un espacio vectorial sobre F, donde F es R o C. Sea o no V un 
espacio con producto interior, podemos aún definir una “norma” |||| como 
una función de valor real en V que satisface las siguientes condiciones para 
toda x, yEV y a€F. 


G) |x| >0 y [lxll =0 si y sólo si x= 0. 
Gi) flex] = la|- [|x. 
Gid |x + yl] < Ilx] + lxil. 


Demostrar que las siguientes son normas en los espacios vectoriales da- 
dos V. 


(a) V = Mmxn(P); || 4|| = max|4,,] para toda 4 €V 
(b) V = C01); IISI] = max |f()| para toda FEV 
(0) V = CM0 1D; NS I= f/1S(O1de para toda f EV 


(d) V = R?; Il (a, b)|| = max {la|, jbl} para toda (a, b) en V 


Utilizar al Ejercicio 20 para demostrar que no hay ningún producto inte- 
rior (., .) en R? tal que |ix||? = (x, x) para toda x €R? si (., .) se define 
como el inciso (d). 


Sea V un espacio con producto interior y defínase para cada par ordenado 
de vectores el escalar d(x, y) = | x — y|| llamado la distancia entre x e y. 
Demostrar, para toda x, y, zE€ V, que 


(a) d(x, y) > 0. 
(b) d(x, y) = dO, x). 


24. 


7.2 
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(c) d(x, y) < d(x, z) + dí(z, y). 
(d) d(x, x) =0. 
(e) d(x, y) 40 si xÆy. 


Sea V un espacio vectorial real o complejo (posiblemente dimensionalmente 
infinito), y sea 8 una base para V. Para x, y EV existen x,, ... , Xx, EB tales 
que 
n n 
x= Dax: y y=3YXbix,. 


i=1 i=1 
Defínase 


n 
aye S ab. 
tT 

Demostrar que (., .) es un producto interior en V. Así pues, todo espacio 
vectorial real o complejo puede ser considerado como un espacio con pro- 
ducto interior. 

Demostrar que si V = R” o C" y £ es la base ordenada estándar, enton- 
ces el producto interior definido anteriormente es el producto interior 
ordinario. 


EL PROCESO DE ORTOGONALIZACION DE GRAM-SCHMIDT 
Y COMPLEMENTOS ORTOGONALES 


En capítulos anteriores vimos el papel especial que las bases ordenadas 
estándar juegan en R". Las propiedades de estas bases se derivan del hecho 
de que los vectores de la base forman un conjunto ortonormal. Así como 
las bases son los “tabiques” con los que se construyen los espacios vecto- 
riales, las bases que son también conjuntos ortonormales son los “tabiques” 
de los espacios con producto interior. Ahora daremos nombre a estas 
bases. 


Definición. Sea V un espacio con producto interior. Un subconjunto B de V es 


una base ortonormal para V si B es una base ordenada ortonormal. 


Ejemplo 10. Si V = F”, entonces la base ordenada estándar es una base 
ortonormal para V. 


Ejemplo 11. 


CEE 


es una base ortonormal para R’. 
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Por supuesto, aún no hemos demostrado que todo espacio del producto 
interior dimensionalmente finito posee una base ortonormal. El siguiente 
teorema nos lleva la mayor parte del camino para la obtención de este 
resultado. Nos dice cómo construir un conjunto ortogonal a partir de un 
conjunto linealmente independiente de vectores, de tal modo que ambos 
conjuntos generan el mismo subespacio. 

Antes de enunciar este teorema consideremos un caso sencillo. Supón- 
gase que (y,, y») es un subconjunto linealmente independiente de: un 
espacio con producto interior (y, por lo tanto, una base para algún sub- 
espacio bidimensional). Nos gustaría construir un conjunto ortogonal a 
partir de (y,, y2} que genere al mismo subespacio. La figura 7.1 siguiente 
sugiere que el conjunto (x,, x») donde x, = y, y X: = ya — Cy, darán 
resultado si se escoge adecuadamente a c. 


y» X2 Y1 57X 


CY] 


figura 7.1 


Para encontrar a c necesitamos únicamente resolver la ecuación siguiente. 


0 = (x2, Y1) = (Y2 — CY Y1) = (Yz, Yi) — CY) Yı) 


Luego 
— Qa yı) 
[ale 
Y entonces 
as Qe, Yı) 
X: = Ya E 
Este proceso puede extenderse a cualquier subconjunto finito linealmente 
independiente. 
Teorema 7.4. Sea V un espacio con producto interior, y sea S = [y,, ... yn} 


un subconjunto de V linealmente independiente. Defínase S! =ÁX,, ..., 
Xn}, donde X, = y, y 


Xk = Yk — D RÁ Xij para 2 <k<n. (1) 
ja [x|]? 
Entonces S' es un conjunto ortogonal de vectores no nulos tales que 
"L(S') = L(S). 


DEMOSTRACIÓN. La demostración se hará por inducción sobre n. Sea 
Sa = [Ys -.. > yn). Si n= 1 entonces el teorema se demuestra haciendo 
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S’ = S; esto es, Xx, = y, 40. Supóngase luego que el conjunto $, = 


= Ses ... , Xxx) ha sido construido mediante el uso de la ecuación o 
con las propiedades necesarias. Demostraremos que el conjunto Si, = 
= {X ..., Xæ Xx) tiene también las propiedades deseadas, donde 
MES 
Xk+1 5 Yk+1 — £ Oiri Deen ZD x, 


fa iel? 


Si xa = 0, entonces la ecuación (2) implicaría yw EL(S,) = L(Sx), 
lo que contradice la suposición de que Sx es linealmente independiente. 
Para 1 < i < k tenemos de la ecuación (2) que 


(Xk+ X) = (rro X) — 2 ON Qiero 2D, x) 


y X 
= Orn x) — Senla =0, 


puesto que, de acuerdo con la suposición de que S, es ortogonal, (x;, 
x;) =0 si ij. Por lo tanto S, es ortogonal. Ahora bien, mediante 
la ecuación (2) tenemos que L(S, ,) € L(Sx,ı). Pero de acuerdo con el 
Teorema 7.3 S; es linealmente independiente; luego dim(L(S' .)) = 
=k+1= ACA Por lo tanto L(S' .) = L(S;.). E 


La construcción de (x,, ... , Xn} usando la ecuación (1) se llama pro- 
ceso de ortogonalización de Gram-Schmidt. 


Ejemplo 12. Sea V = R? y sean y, = (1, 1, 0), y: = (2, 0, 1)e ys = 
= (2, 2, 1). Entonces (y,, yz, ya) es linealmente independiente. Utilizare- 
mos la ecuación (1) anterior para calcular los vectores ortogonales x,, x» 


y Xy. Tómese x, = (1, 1, 0). Entonces [|x,||* = 2, y así 
my — pe 


=(2,0,1) -501,1,0) 


= (1, —1,1). 
Finalmente, 


(y3, x1) CRES 
xX == — x PA. AE 
A OS par 


= PEA asla a 
= (2,2, 1) z (l 1, 0) 3 L 1,1) 


= (=< 1 3): 
3°73? 3 
Teorema 7.5. Sea V un espacio dimensionalmente finito con producto interior. 
Entonces V tiene una base ortonormal B. Además, si B = {Xı, Xz, - +. > Xn} 
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y xEV, entonces 


n 


x= J (x, x:)x;. 


1 1 


DEMOSTRACIÓN. Sea f, una base ordenada para V. Aplicando el Teore- 
ma 7.4 para obtener un conjunto ortogonal 8’ de vectores no nulos con 
L(8') = L(B,) = V. Dividiendo cada vector de 8” entre su longitud, 
obtenemos un conjunto ortonormal f£ que genera a V. De acuerdo con 
el Teorema 7.3, 8 es linealmente independiente y, por lo tanto, f£ es una 
base ortonormal para V. 


Sea B = [X1, ..., Xn} y sea x € V. Entonces 
n 
x= Y ax; 
i=1 
para algunos escalares a;. Para 1 < j < n tenemos que 


HA HA 
(6 x) = ( Zax x)= È ain xp) 
i 


i=1 =1 


I! 
M 
Q 
> 
23 
E 


Ejemplo 13. Utilizando el conjunto ortogonal obtenido en el Ejemplo 12, 
podemos obtener la base ortonormal 


1 1 1 | 
—(1, 1, 0), —- (1, =L Dal 1, 2) L. 
E > í a j 


Sea x = (2, 1, 3). Calcularemos los “coeficientes” de x como se dan en 
el Teorema 7.5: 


a = ERE 45 1) = En d, — lo s 3) m L 
V2 y 2” Y 3 vV? 


a; == E + 1+6) = 2 
v6 v6 


Como verificación, tenemos que 
3 4 5 
= — 1 —(1, —1, 1) 4 —(—1, 1 A 
(2, 1, 3) z(h 0) +0, , EA > 1, 2) 


Así pues tenemos una manera muy sencilla de calcular los coeficientes 
de un vector dado cuando se expresa como una combinación lineal de 
vectores en una base ortonormal. 

El mismo teorema proporciona un método sencillo para obtener la re- 
presentación matricial de un operador lineal. 
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Corolario. Sea V un espacio dimensionalmente finito con producto interior con 
una base ortonormal B = (X,, ... , Xa}. Sea T un operador ortonormal en 
V, y sea A = [Tlg. Entonces Ai; = (T(X,), Xi). 


DEMOSTRACIÓN. Del Teorema 7.5 tenemos que 
T) = 2 (Tx), Xi)Xi- 
i=1 
Por lo tanto Ai; = (T(x;), xi). E 


Los escalares (x, x;) asociados con x han sido estudiados extensiva- 
mente para ciertos espacios vectoriales especiales. Aun cuando los vectores 
Xis... , Xa se escogieron de una base ortonormal, consideraremos conjun- 
tos B más generales para la definición de los escalares (x, x;). 


Definición. Sea B un subconjunto ortonormal (posiblemente infinito) de un es- 
pacio con producto interior V, y sea Xx EV. Definimos los coeficientes de 
Fourier de x relativos a 8 como los escalares (x, y), donde y € B. 


En el siglo diecinueve el matemático francés Jean Baptiste Fourier 
estuvo dedicado al estudio de los coeficientes 


fro sen ntdt y fro cos nt dt, 
(0) 0 


o, más generalmente, 


1 ò" : 
AAA í Dai dt, 
a f De 


de una función f. En el contexto del Ejemplo 9, vemos que Cn = (f, e"); 
esto es, c, es el n-ésimo coeficiente de Fourier de una función continua 
fEH relativo a S. Estos coeficientes son los coeficientes “clásicos” de 
Fourier de una función; la literatura concerniente al comportamiento de es- 
tos coeficientes es bastante extensa. Aprenderemos más sobre estos coefi- 
cientes de Fourier en el resto de este capítulo. 


Ejemplo 14. Sean V =H y f(x) = x. Calculemos los coeficientes de Fou- 
rier de f relativos al conjunto ortonormal S del Ejemplo 9, Utilizando la 
integración por partes tenemos, para n O, 

: 1 2mo 1 II. el 
(f, en”) = f tei"! dt ES te-i”! dt = DEEE 
0 


2r 0 in 


Y paran=0 


p 
i 


(G, 1) se IE 
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Ahora bien, de acuerdo con el Ejercicio 14 tenemos que 


> ep 


n= 


para toda k. Luego, empleando el hecho de que ||f||* = Lar, tenemos 
4 SES O! 
>r > ao ES 
a m| TA 


Como esta desigualdad es cierta para toda k, tenemos mediante el 
uso adecuado de los límites que 
4 Ed 
=r > 5 —. 
a 2 n? 
Usando otras funciones pueden obtenerse otros resultados semejantes. 
Estamos ya preparados para proceder con el concepto de un “comple- 
mento ortogonal”. 


Definición. Sea V un espacio con producto interior y sea S un subconjunto de 
V. Definimos a S como el conjunto de todos aquellos vectores de V 
que son ortogonales a todos los vectores de S; esto es, SŁ = 4x e V: (x,y) 
= 0 para toda y €S}. A S+ se le llama complemento ortogonal de S. 


Es fácil demostrar que S+ es un subespacio de V para cualquier sub- 
conjunto S de V. 


Ejemplo 15. El lector deberá verificar que (0)- =V y Vl= {0}. 


Ejemplo 16. Si V = R? y S= {x}, entonces S} es sencillamente el con- 
junto de todos los vectores que son perpendiculares a x. (Ver el Ejer- 
cicio 5.) 


El Ejercicio 16 proporciona un ejemplo interesante de un complemento 
ortogonal en el caso en que V sea dimensionalmente infinito. 

El uso de la palabra “complemento” se aclarará con el siguiente teo- 
rema. 


Teorema 7.6. Sea W un subespacio dimensionalmente finito de un espacio con 
producto interior V. Entonces V = W Q WŁ. 


DEMOSTRACIÓN. Por el Teorema 7.5 podemos escoger una base ortonor- 
mal (x,, ... , xx) para W. Entonces, para y €V, defínase 


k 
VSE, u) yY 5y- J. 


%t=1 
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Es evidente que y = y, + y» y y, EW. Con el objeto de demostrar que 
V = W + WŁ, debemos demostrar que y, € WŁ., para lo cual es sufi- 
ciente demostrar que (y., y;) = 0 para j= 1,..., k. Ahora bien, 


(Ya xj) = (y — Y Xx) = 0, Xx) — O xX). 
Pero 


(Yis x;) => (2 (y, X¡)X;, x,) Goa > (y, XX Xn xy) => y (y, x:)Ó;, Ea (y, xy). 


Por lo tanto (yo, y;) = 0. 
Para completar la demostración debemos demostrar que W ^ W+ 
= (0). Pero si x € W A Wi, entonces (x, x) = 0. Por lo tanto x = 0. MW 


El siguiente resultado es una consecuencia inmediata de la demostra- 
ción del Teorema 7.6. 


Corolario 1. Bajo la hipótesis del Teorema 7.6, si [X,, ... , Xx) es una base 


ortonormal para W y si y EV, entonces 
k 
y = YN (y,X)X +z, 
1=1 


donde z € WH. 


Corolario 2. Sea V un espacio con producto interior dimensionalmente finito y 


sea W un subespacio de V. Entonces dim(W) + dim(W-) = dim(V). 


Ejemplo 17. Sea V = F3 y W = L({e,, e2}). Entonces x = (a, b, c) € WŁ 
si y sólo si 0 = (x, €e,) =a y 0 = (x, e) = b. Así, x = (0, 0, c) y por 
lo tanto W+ = L((e,)). Se puede deducir el mismo resultado simplemente 
notando del Corolario 2 que dim(W) = 1 y que el vector e, es ortogonal 
tanto a e, como a e». 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) El proceso de ortogonalización de Gram-Schmidt nos permite construir 
un conjunto ortonormal a partir de un conjunto arbitrario de vec- 
tores. 

(b) Todo espacio dimensionalmente finito con producto interior posee 
una base ortonormal. 

(c) El complemento ortogonal de cualquier conjunto es un subespacio. 
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(d) Sig = (x,..., x,) es una base para un espacio con producto inte- 
rior V, entonces, para cualquier x € V, los escalares (x, xi) (= 1,..., 
n) son los coeficientes de Fourier de x. 

(e) Para cualquier subespacio W de un espacio con producto interior di- 
mensionalmente finito V, tenemos que V = W O WŁ. 

(f) Una base ortonormal debe ser una base ordenada. 


En cada uno de los incisos siguientes aplicar el proceso de Gram-Schmidt al 
subconjunto dado S del espacio con producto interior V. Entonces encontrar 
una base ortonormal 8 para V y calcular los coeficientes de Fourier para el 
vector dado relativos a 8. Utilizar, finalmente, el Teorema 7.5 para verificar 
el resultado. 


(a) V=R,S= ((1,0,1,), (0, 1,1), (1,3,3)) y x= (1, 1,2) 
œ) V=R,5S=((1,1,1),(0,1,1),(0,0,1))yx= (1,0, 1) 


(c) V= P,(R) con el producto interior (he) = roza 


S=([(Lxx)yH)=1+x 
(d) V=: Œ, S= {(1,i, 0), (1 — i, 2, 4i) y x= ((1, 2.+ 3i, 1)) 


72) E yat 


Sean V = R? y 


Encontrar los coeficientes de Fourier para (3, 4) relativos a B. 
Sean V = Œ y S= {(1, 0, i), (1, 2, 1)}. Calcular S+. 


Sean V = R? y S= {x} donde x, 4 0. Describir geométricamente a S+, 
Si {xı, x») = So es linealmente independiente, describir geométricamente 
a Si. 


Sea V un espacio con producto interior, y sea W un subespacio dimensional- 
mente finito de V. Si xW, demostrar que existe y € V tal que y € W+ pero 
con (x, y) 40. Sugerencia: Utilizar el Corolario 1 del Teorema 7.6. 


Demostrar que si (y,, .., Ya} es un conjunto ortogonal de vectores no nulos, 
entonces los vectores (x,, ... , xn) derivados del proceso de Gram-Schmidt 
satisfacen a x; = y; parai=1,...,n. Sugerencia: Utilizar inducción. 


Sea V = C? con el producto interior ordinario, y sea W = L({(i, 0, 1)}). 
Encontrar bases ortonormales para W y W+. 


Sea W un subespacio dimensionalmente finito de un espacio con producto 
interior V. Demostrar que existe una proyección T en W tal que N(T) = WŁ. 


10. 


11. 


12.* 


13. 


15. 


16. 
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Además, demostrar que ||T(x)|| < |!x]| para toda x €V. Sugerencia: Em- 
plear el Ejercicio 10 de la Sección 7.1. 


Sea A una matriz de n x n con elementos complejos tales que los renglones 
de A forman un conjunto ortonormal. Demostrar que AA* = I. 


Sean W, y W. subespacios de un espacio con producto interior dimensional- 
mente finito. Demostrar que (W, + W.) = WE AO W y (W, N W,)! = 
Wi + Wł. 


Sea V un espacio con producto interior y sean S y S, subconjuntos de V. 
Demostrar los siguientes incisos: 

(a) So SS implica que S+ < SŁ. 

(b) S< (SS), y entonces L(S) < (S+). 

(c) Si W es un subespacio dimensionalmente finito de V, entonces 


W = (W“)+. Sugerencia: Utilizar el Ejercicio 6. 


Identidad de Parseval. Sea [x,, ... , x,) una base ortonormal para V. De- 
mostrar, para cualesquiera x, y €V, que 


(x, y) = Y (5 00% x). 


Sea V un espacio con producto interior y sea S = [x,, ... , x,) cualquier 
subconjunto ortonormal de V. Demostrar que para cualquier x en V tene- 
mos que 


xl > $ x, x0 f- 


Esta desigualdad se llama desigualdad de Bessel. Sugerencia: Aplicar el 
Corolario 1 del Teorema 7.6 a xEV y W = L(S). Luego emplear el Ejer- 
cicio 10 de la Sección 7.1. 


Sea T un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Si (T(x), y) = O para toda x, y €V, demostrar que T = T.. 
De hecho, demostrar este resultado si la igualdad se cumple para toda x e 
y en alguna base para V. 


Sea V = C([—1, 1]). Supóngase que We y W, son los subespacios de V 


formados por las funciones pares e impares, respectivamente. Demostrar 
que WŁ =W, si el producto interior en V es 


(f, g8) = f Dg dt. 
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7.3 EL ADJUNTO DE UN OPERADOR LINEAL 


En la Sección 7.1 definimos a la transpuesta conjugada A* de una matriz 
A. Para un operador lineal T en un espacio con producto interior V, defi- 
niremos ahora un operador lineal relacionado en V llamado el “adjunto” 
de T, cuya matriz es [14 donde f es cualquier base ortonormal de V. 
La analogía entre la conjugación compleja de números complejos y los ad- 
juntos de los operadores lineales pronto se hará aparente. Primero, sin 
embargo, necesitamos un resultado preliminar. 

Sea V un espacio con producto interior y sea y€V. La función 
g: V— F definida mediante g(x) = (x, y) para toda x €V es claramente 
lineal. Más importante es el hecho de que si V es dimensionalmente finito, 
toda transformación lineal de V en F es de esta forma. 


Teorema 7.7. Sea V un espacio con producto interior dimensionalmente finito 
sobre F, y sea g: V—F una transformación lineal. Entonces existe un 
vector único y EV tal que g(x) = (x, y) para toda x € V. 


DEMOSTRACIÓN. Sea 8 una base ortonormal para V, digamos 8 = (x,,. 
Xn), y sea 


..3 


y = Y oglxi)xi. 
i=1 
Si definimos a h: V— F mediante h(x) = (x, y), entonces h es clara- 
mente lineal. Ahora bien, para 1 < j < n tenemos 


haD = (n 9) = (1 3 Ia ) = È gad an x) 


= Š g(x); = g(x;). 


Como g y h coinciden en f, tenemos, de acuerdo con el corolario del 
Teorema 2.7, que g = h. 

Para demostrar que y es única, supóngase que g(x) = (x, y') para 
toda x. Entonces (x, y) = (x, y’) para toda x y entonces por el Teorema 
7.1 tenemos que y = y’. E 


Ejemplo 18. Defínase a g: R?— R mediante g(a,, a) = 2a, + az; evi- 
dentemente g es una transformación lineal. Sea Bi1= {e,, e,) y, como en 
la demostración del Teorema 7.7, sea y = g(e,)e, + gle:)e: = 2e, + 
+ €, = (2, 1). Entonces g(a,, az) = ((a,, @&-), (2, 1)) = 2a, + a. 


Teorema 7.8. Sea V un espacio con producto interior dimensionalmente finito 
y sea T un operador lineal en V. Entonces existe un operador lineal único 
T* en V tal que (T(x), y) = (x, T*(y)) para toda x, y EV. 
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DEMOSTRACIÓN. Sea y€V. Defínase a g: V—F mediante g(x) = 
= (T(x), y) para toda x €V. Primero demostraremos que g es lineal. Sean 
X,, X2 EV y CEF. Entonces gí(cx, + x) = (Tí(cx, + x), y) = (cT(x,) + 
+ T(x2), y) = c(T(x), y) + (Tx), y) = cglx,) + g(x). Por lo tan- 
to, g es lineal. 


Ahora podemos emplear el Teorema 7.7 para obtener un vector único 
y' EV tal que g(x) = (x, y”); esto es (T(x), y) = (x, y”), para toda x € V. 
Definiendo a T*: V— V mediante T*(y) = y”, tenemos que (T(x), y) = 
= (x, T*(y)). 

Para demostrar que T* es lineal, sean y,, y. EV y c EF. Entonces para 
cualquier x € V tenemos 


(x, T*(cy, + y2)) = (T(x), cyi + yo) 

¿(T(x), y) + (T(x), y2) 
clx, T*(y,)) + (x, T*(y:)) 
(x, CTO) + T*(y2)). 


Como x es arbitraria, tenemos que T*(cy, + y:) = cT*(y,) + T*(y,) de 
acuerdo con el Teorema 7.1(d). 

Finalmente, sólo nos queda demostrar que T* es única. Supóngase que 
U: VW>V es lineal y satisface a (T(x), y) = (x, U(y)) para toda x, 
y EV. Entonces (x, T*(y)) = (x, U(y)) para toda x, yEV y finalmente 
T*=U E 


El operador lineal T* descrito en el Teorema 7.8 se llama adjunto del 
operador T. El símbolo T* se lee “T asterisco”. 

Luego, T* es el único operador en V que satisface a (T(x), y) = 
= (x, T*(y)) para toda x, y €V. Nótese que también 


CTO) = TO), x) = (y, T*(x)) = (1*(x), y) 


y así (x, T(y)) = (T* (x), y) para toda x, y €V. Podemos ver estas ecua- 
ciones simbólicamente como que añadimos un * a T cuando cambiamos 
su posición dentro del símbolo de producto interior. 

En el caso dimensionalmente infinito, el adjunto de un operador lineal 
T puede definirse como el operador lineal T* que satisface a (T(x), y) = 
= (x, T*(y)) para toda x, y€V. La unicidad de T* se deducirá como 
anteriormente. Sin embargo, no se garantiza la existencia de un adjunto. 
El lector deberá observar ła necesidad de la hipótesis de dimensionalidad 
finita en la demostración del Teorema 7.7. Muchos de los teoremas que 
demostraremos sobre adjuntas son, sin embargo, independientes de la di- 
mensión de V. Entonces, para el resto de este capítulo, adoptaremos para 
los ejercicios la convención de que, una referencia al adjunto de un ope- 
rador lineal en un espacio con producto interior dimensionalmente infinito, 
presupone que tal adjunto existe. 

Un resultado útil para obtener adjuntos es el Teorema 7.9 que sigue. 
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Teorema 7.9. Sea V un espacio con producto interior dimensionalmente finito, 
y sea B una base ortonormal para V. Si T es un operador lineal en V, en- 
tonces 


[T*], = [Mx 


DEMOSTRACIÓN. Sean A = [Tlg, B = [T*la y B= {xn ... . xn). Enton- 
ces, del corolario del Teorema 7.5, tenemos que 


B; = (T*(x;), x5) = (xi, T*(x;)) 
= (T(x), x) = An = (A*);;. 
Por lo tanto B = A*. E 


Corolario. Sea A una matriz de n x n. Entonces E = (L,)* A 


DEMOSTRACIÓN. Si 8 es la base ordenada estándar para F" entonces, en 
virtud del Teorema 2.17, tenemos que [Lı] = A. Por lo tanto, 
[(1)*, = [LJ]? = 4* = [Le], y así (LY*= Ly. E 


Como aplicación de lo anterior, calcularemos el adjunto de un ope- 
rador lineal específico. 


Ejemplo 19. Sea T: C*— C? definido mediante T(a,, a) = (2ia, + 3a», 
a, — a»). Si B es la base ordenada estándar para C?, entonces 


[T]; = E a) 


Luego 


Por lo tanto 
T* (a, a.) = (—2ia, + do, 3a, — a). 


El siguiente teorema demuestra la analogía entre los complejos con- 
jugados de los números complejos y los adjuntos de los operadores li- 
neales. 


Teorema 7.10. Sea V un espacio con producto interior dimensionalmente fini- 
to y sean YT y U operadores lineales en V. Entonces 


(a) (T +U)* = T* + U*, 

(b) (cT)* = ET* para cualquier c€ F. 
(c) (TU)* = U*T*, 

(d) T** =], 

(e) ISh 
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DEMOSTRACIÓN. Demostraremos (a) y (d); el resto se demuestra de la 
misma manera. Sea x. vEV. 
Como 


(x, (T + U)*(y)) 


l 


((T+U)(x), y) = (T(x) + U(x), y) 
= (T(x), y) + (U(x), y) = (x, T*(y)) + (x, U*(y)) 
(x, (y) + U*(y)) = (x, (1* + U*)(y)), 


| 


| 


se sigue el inciso (a). 
De la misma manera, como 


(x, T(y)) = (T*(x), y) 
(x, T**(y)), 


|! 


se obtiene (d). B 


La misma demostración opera en el caso dimensionalmente infinito, 
siempre y cuando se suponga la existencia de T* y U*. 


Corolario. Sean A y B matrices de n x n. Entonces 


(a) (A + B)* = A* | B*. 

(b) (ŒA)* = TA* para toda cEF. 
(c) (AB)* = B*A*. 

(d) A** =A. 

(e) I*=1. 


DEMOSTRACIÓN. Demostraremos únicamente el inciso (c), los incisos res- 
tantes se pueden demostrar de manera semejante. 


Como Lis)» = (Lyn)* = (L La)* = (L,J*(L,y* = Lol == Lgi tene- 
mos que (4B)*= B*A*. E 


En la demostración anterior nos apoyamos en el corolario del Teore- 
ma 7.9. Una demostración alternativa se daría acudiendo directamente a 
la definición de transpuesta conjugada. (Ver Ejercicio 5.) 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Considérese que 
los espacios con producto interior subyacentes son dimensionalmente fi- 
nitos. 

(a) Todo operador lineal tiene un adjunto. 


(b) Todo operador lineal en V tiene la forma x — (x, y) para alguna 


y EV. 
(c) Para todo operador lineal T en V y toda base f de V, [T*] = 


e 
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(d) El adjunto de un operador lineal es siempre único. 
(e) Para operadores cualesquiera T y U, y escalares a y b, 
(aT + bU)* = aT* + bU*. 
(f) Para cualquier matriz A de n x ML 


(g) Para cualquier operador T, (T*)* = T. 


Para cada uno de los siguientes espacios con producto interior V (sobre F ) 
y transformaciones lineales g: V— F, encontrar un vector y tal que 
g(x) = (x, y) para toda x€V. 


(a) V= R, g(a, a», az) = a, — 2a, + 4a, 
(b) V= Cs: g(z,, Zə) Ere 2z 


(c) V= P.(R) con (f, h) = ronoa, 9) = I0) + PA) 


Para cada uno de los siguientes espacios con producto interior V y opera- 
dores lineales T en V, evaluar T* en el elemento dado de V. 


(a) V=ẹR, T(a, b) = (2a + b, a — 3b), x= (3, 5) 
(b) V=GC>, Tzi, 22) = Qu + izo, (1 — i)z), 


x= (3 —i, 1 +2i) 
(c) V= P.(R) con 


60= S ODd, 1N=1+3, 
0 
f(x) =4--x+3x 
Completar la demostración del Teorema 7.10. 


Completar la demostración del corolario del Teorema 7.10 de dos maneras. 
Primero emplear el Teorema 7.10 tal como en la demostración de (c). Lue- 
go emplear la definición matricial de A*, 


Sea T un operador lineal en un espacio con producto interior V. Sean 
U: = T + T* y U: = TT*. Demostrar que U, = U*F y U, = UF. 


Dar un ejemplo de un operador lineal T en un espacio con producto interior 
V tal que N(T) 4N(T*). 


Sea V un espacio con producto interior dimensionalmente finito, y sea T 
un operador lineal en V. Demostrar que si T es invertible, entonces T* es 
invertible y (T*)* = (T2)*. 


Demostrar que si V = W ® W- y T es la proyección en W con N(T) = Wi, 
entonces T = T*, 


10. 


11. 


12,* 


15. 


16. 


7.4* 
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Sea T un operador lineal en un espacio con producto interior V. Demos- 
trar que ||T(x)|| = |ix|| para toda x €V si y sólo si (T(x), T(y)) = (x, y) 
para toda x, y €V. Sugerencia: Emplear el Ejercicio 20 de la Sección 7.1. 


Para un operador lineal T en un espacio con producto interior V, demostrar 
que T*T = T, implica que T = To. ¿Es cierto el mismo resultado si supone- 
mos que TT* = T,? 


Sea V un espacio con producto interior dimensionalmente finito y, sea T 
un operador lineal en V. Demostrar que R(T*) = N(T). Sugerencia: De- 
mostrar que R(T*)* = N(T), y luego utilizar el Ejercicio 12(c) de la Sec- 
ción 7.2. 


Sea T un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Demostrar los siguientes incisos. 


(a) N(T*T) --N(T). Deducir que rango(T*T) = rango(T). 

(b) rango(T) = rango(T*). Deducir de (a) que rango(TT*) = rango(T). 

(c) Para cualquier matriz A den x n, rango(A*4) = rango(AA*) = ran- 
go(A). 


Sea V un espacio con producto interior y sea y, z EV. Defínase a T: VW=>V 
mediante T(x) — (x, y)z para toda x€V. Primero demostrar que T es 
lineal. Luego demostrar que T* existe y definirla explícitamente. 


Sea T: V— W una transformación lineal entre los espacios con producto 
interior dimensionalmente finitos V y W. 


(a) Demostrar que existe una transformación lineal única T*: W-=>V 
tal que (T(x), y) - (x, T*(y)) para toda x EV, y EW. 

(b) Sean f y y las bases ortonormales respectivas para V y W. Demos- 
trar que [TJP = (M*. 


Sea A una matriz de n » n. Demostrar que det(A*) = det(A). 


LA TEORIA ESPECIAL DE LA RELATIVIDAD DE EINSTEIN 


Como resultado de los experimentos físicos realizados durante la segunda 
mitad del siglo diecinueve (de una manera más sobresaliente, el experi- 
mento de Michelson-Morley de 1887), los físicos concluyeron que los re- 
sultados obtenidos en la medición de la velocidad de la luz son indepen- 
dientes de la velocidad del instrumento utilizado para medirla. Por 
ejemplo, supóngase que estando en la Tierra un experimentador mide la 
velocidad de la luz emitida por el Sol y encuentra que es de 300 000 
kilómetros por segundo. Ahora supóngase que el experimentador coloca 
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el equipo de medición en una nave espacial y abandona la Tierra viajando 
a 160 000 kilómetros por segundo alejándose del Sol. Una repetición del 
mismo experimento desde la nave espacial arrojaría el mismo resultado: 
¡La luz está viajando a 300 000 kilómetros por segundo relativa a la nave 
espacial y no a 140 000 kilómetros por segundo como era de esperarse. 

Esta revelación condujo a una nueva manera de relacionar los sistemas 
coordenados empleados para ubicar a los eventos en el espacio-tiempo. 
El resultado fue la teoría especial de la relatividad de Albert Einstein. 
Desarrollaremos la esencia de la teoría de Einstein desde el punto de 
vista del álgebra lineal. 

El problema básico es comparar dos distintos sistemas de coordenadas 
sin aceleración, que están en movimiento relativo uno con respecto al otro 
bajo la suposición de que la velocidad de la luz es la misma, medida en 
ambos sistemas. Supóngase que nos dan dos sistemas coordenados iner- 
ciales (sin aceleración) S y S’ en un espacio de tres dimensiones (R*) 
y tales que S' se desplaza a una velocidad constante en relación con S, 
medida a partir de S (ver la Fig. 7.2). Para simplificar las cosas, supon- 
gamos que: 


Z Z 


figura 7.2 


1. Los ejes correspondientes de S y S (x y x', y e y”, z yz) son 
paralelos y el origen de S' se desplaza en la dirección positiva 
del eje x de S a una velocidad constante v > O relativa a $. 

2. Se colocan dos relojes C y C’ en el espacio —el primero estacio- 
nario relativo al sistema de coordenadas $ y el segundo estacionario 
relativo al sistema de coordenadas S’. Estos relojes están diseña- 
dos para dar como lecturas números reales en unidades de tiempo 
(segundos). Se calibran los relojes de manera que en el instante 
en que los orígenes de S y S’ coincidan, ambos relojes den la 
lectura cero. 

3. Nuestra unidad de longitud será el segundo luz (la distancia que 
recorre la luz en un segundo) y nuestra unidad de tiempo será el 
segundo. Nótese que con respecto a estas unidades la velocidad 
de la luz es de un segundo luz por segundo. 
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Dado un evento cualquiera (cualquier cosa cuya posición y tiempo de 
ocurrencia pueda ser descrito) le podemos asignar un conjunto de coor- 
denadas de “espacio-tiempo”. Por ejemplo, si p es un evento que ocurre 
en una posición 


Xx 


y 
Z 


relativa a S en un tiempo 1 leído en el reloj C, podemos asignar a p 
el conjunto de coordenadas 


= NX 


Esta cuarteta ordenada se denomina las coordenadas espacio-tiempo de 
p relativas a S y a C. De la misma manera p tiene un conjunto de coor- 
denadas espacio-tiempo 


n <> 


relativas a S y a C’. 

Podemos definir un mapeo T.: R*>R' (que depende de la veloci- 
dad v) como consecuencia de lo anterior tal que, para cualquier conjunto 
de coordenadas de espacio-tiempo 


~ Nn = X 


que miden un evento con respecto a $ y a C, 


X X 
y + 
T|? |=, 
Z Z 
t t 


es el conjunto de coordenadas espacio-tiempo de este evento con respecto 
a S' y a C’. Es evidente que T, es uno-a-uno y sobreyectivo. 

Einstein hizo ciertas suposiciones sobre T, que condujeron a su teoría 
especial de la relatividad. Formularemos un conjunto equivalente de supo- 
siciones. 
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Axiomas de la teoría especial de la relatividad 


R,: La velocidad de cualquier haz de luz, al ser medida en cualquiera 
de los sistemas coordenados utilizando un reloj estacionario rela- 
tivo al mismo sistema, es 1. 

R.: El mapeo T.: Rt— Rt es lineal. 


R;,: Para cualquier 


x 
y e R4, 
Z 
t 
si 
x x’ 
1, >] 4], 
Z Z 
t t 
entonces y = y yz =z. 
R,: Para 
x x' 
11-141, 
zZ Z 
t t 


x' y f' son independientes de y y z; esto es, si 


, tt 


X X xX xX 

Yı y’ Y2 y” 
Ta = ' y T, F ap 

Zi Z Z3 Zz 

t t t e 


entonces x” = x y =f., 


Rs: El origen de S se desplaza en la dirección negativa del eje X’ 
de S' a una velocidad constante —v < O medida desde S’. 


Como veremos, estos 5 axiomas (R,, R., Ra, R; y R;,) caracterizan 
completamente a T,. El operador T, se llama transformación de Lorentz 
en la dirección x. Pretendemos calcular T, y utilizarla para estudiar los 
curiosos fenómenos de la contracción del tiempo. 


Teorema 7.11. En Rt 


(a) T.(e,) = €;¡ para i= 2, 3: 
(b) L((e,, €es)) es T,-invariante. 
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(c) L(fe,, e,)) es T,-invariante. 
(d) L(([e., €3)) y L((e,, €4)) son T*-invariantes. 
(e) T*(e,) = e, para i= 2, 3. 

DEMOSTRACIÓN. 


(a) Por el axioma R. 


0 0 
e n a 
0 0 
0 0 
y por lo tanto, por el axioma R,, las coordenadas primera y cuarta de 
0 
rle 
Vo 
0 
son iguales a cero para cualquier a, b € R. Luego, por el axioma R, 
0 0 0 0 
A A a e S 
0 0 l l 
0 0 0 0 


Las demostraciones de los incisos (b), (c) y (d) se dejan como ejer- 
cicios. 

(e) Para cualquier j=4-2, en virtud de (a) y (c), (T*(e2), es) = 
= (en To(ej)) = 0; para j=2, por (a), (T* (e+), ej) = (ez, T,(e,)) 
T*(e:) = àe: para alguna à €R. Entonces 1 = (ez, e) = (es, Tr(e2)) = 
= (T* (e), e) = (Ae», e2) = A y, por lo tanto, T*(e2) = e, De la 
misma manera T*(e.) = e.. W 


Supóngase que en el instante en el que los orígenes de S y S’ coin- 
ciden se emite un destello luminoso desde su origen común. Cuando este 
evento se mide relativo a S$ y C o relativo a S' y C’ tiene coordenadas 
espacio-tiempo 


o ooo 
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Sea P el conjunto de todos los eventos cuyas coordenadas espacio-tiempo 


~ N <= = 


relativas a $ y C son tales que el destello se observa en el punto de 
coordenadas 
x 


y 
Z 


(medidas con respecto a S) en el instante £ (medido en C). Permítasenos 
caracterizar a P en términos de x, y, z y f. Como la velocidad de la 
luz es 1, en cualquier instante z > O el destello se observa desde cualquier 
punto cuya distancia al origen de S (medida a partir de S) sea 1: 15t. 
Estos son justamente los puntos que se localizan sobre la superficie de 
la esfera de radio f con centro en el origen Las coordenadas (relativas 
a S) de tales puntos satisfacen la ecuación x? + y? + z? = £. Por lo tanto, 
un evento está en P si y sólo si sus coordenadas espacio-tiempo relativas 
aSyac 


(1 > 0) 


~ N <> 


satisfacen la ecuación x? -+ y? -+ 22 f=- 0. En virtud del axioma R, 
podemos caracterizar a P en términos de las coordenadas espacio-tiempo 
relativas a S’ y a C' de la misma manera: un evento está en P si y sólo 
si sus coordenadas espacio-tiempo relativas a S’ y a C” 


x 
Sl C29 
Z 
t 
satisface la ecuación (x)? + (y)? + (z)? — (12)? = 0. 
Sea 
100 0 
010 0 
A = . 
0 0 1 0 
O 0 0O —!1 
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Teorema 7.12. Para cualquier w € R*, si (La(w), w) = 0, entonces (TFL,T_(w), 
w) =0. 


DEMOSTRACIÓN. Sea 


nY Y 


y supóngase que (L,¿(w), w) = 0. 


Caso 1. 1 >0. Como (L¿(w), w) = x? + y? + z? — £, w es el conjunto 
de coordenadas de un evento de P relativos a $ y a C. Como 


x x 
y y 

y ; 
VA A 
t t 


son las coordenadas espacio-tiempo del mismo evento relativas a S' y a 
C’, la discusión que precede al Teorema 7.12 da 


PEJE EJ 0 
Luego entonces, (T*L4T (w), w) = (LaTe(w), To(w)) = (x)? + Q)? + 
+ (22)? — (1)? = 0, y se obtiene la conclusión. 
Caso 2. 1<0. La demostración se obtiene al aplicar el Caso 1 a — w. 


Procedamos ahora a deducir información acerca de T,. Sean 


l 1 
w = E y w= 91. 

0 0 

l —1 


Por el Ejercicio 3, (w,, Wz} es una base ortogonal para L((e,, e4}), y 
L((e,, e,}) es T*L,T -invariante. El siguiente resultado nos dice aún más. 


Teorema 7.13. Existen escalares a y b no nulos tales que 
(a) T*L,T,(w,) = aw, 
(b) T*L,T, (wo) + bw,. 
DEMOSTRACIÓN, 


(a) De acuerdo con el Teorema 7.12, (L¿(w,), w:) = 0, (TFL,T, 
(w,), w,) = 0. Entonces, T*L,T,(w,) es ortogonal a w,. Como L((e,, 
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e1)) = L((w,, w.)) es T*L,T,-invariante, T*L,T,(w,) debe pertenecer a 
este conjunto. Pero (w,, w.) es una base ortogonal para este subespacio, 
y entonces T*L,T,(w,) debe ser un múltiplo de w». Así, TFL,T,(w,) = aw. 
para algún escalar a. Como T, y A son invertibles, también T*L¿T, lo es. 
Luego a 0, demostrando así (a). La demostración de (b) es seme- 
jante. E 


Corolario. Sea B, = [T,]g, donde B es la base ordenada estándar para R'. En- 


tonces 


(a) B*AB, = A. 
(b) Trh Tes iy 


Dejaremos como ejercicio la prueba del corolario. Para algunas suge- 
rencias, véase el Ejercicio 4. 

Consideremos ahora la situación cuando ha transcurrido un segundo 
desde que los orígenes $ y S’ coincidieran medido por el reloj C. Como el 
origen de S’ se desplaza a lo largo del eje x con una velocidad v medida 
en S, sus coordenadas espacio-tiempo relativas a S y C son 


v 
0 
0 
l 


De la misma manera, las coordenadas espacio-tiempo para el origen de 
S' relativas a S’ y a C’ deben ser 


e... 
`~ 


para algún ? > 0. Entonces tenemos que 


v 0 
0 0 
T = para algún /” > 0. (3) 
0 0 
1 t 
Por el corolario del Teorema 7.13 
v v v v 
0 0 0 0 
TEL TA l, =p E aL 4) 
“*"toPlo toPlo 
1 1 l 1 
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Pero también 


[2 v v v 0 0 
0 0 0 0 0 0 
TILT; , = L,T, els = L P = —(Y?, 
ofto “o 0 Toplo (0) 
1 l ] l t t 
(5) 
Combinando las ecuaciones (4) y (5), concluimos que 
vol=- (2), o bien r: Viv. (6) 
Luego, de las ecuaciones (3) y (6), obtenemos 
v 0 
aoe S (7) 
0 0 
1 VI — v? 


Recuérdese luego que el origen de S se desplaza en la dirección nega- 
tiva del eje x de S' con la velocidad constante —v < O medida desde S’. 
(Este hecho es el axioma R;5.) En consecuencia, un segundo después de 
que los orígenes de S y S’ coincidieran medido con el reloj C, existe un 
tiempo 1 > 0 medido en el reloj C’ tal que 


0 —ot' 
0 0 
T, = . 8) 
0 (8 
1 


0 


1 


t 


De la Ecuación (8) se obtiene, de una manera semejante a como se 
obtuvo la Ecuación (7), que 


a l 


y, por lo tanto, de las Ecuaciones (8) y (9) 
a 
0 s/l — y? 
0 0 
l 1 
a/l — v? 


El siguiente resultado se puede demostrar fácilmente utilizando las Ecua- 
ciones (7) y (10), y el Teorema 7.11. 
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Teorema 7.14. Sea B la base ordenada estándar para R*. Entonces 


l —y 


a/l — v? i a/l — y? 
0 1.0 0 
I =B,= 
(Tola 0 0 1 0 
—y ] 


s/l — y? O s/l — y? 


Contracción del tiempo 


Una conclusión por demás curiosa y paradójica se deriva si aceptamos la 
teoría de Einstein, la de la contracción del tiempo. Supóngase que un 
astronauta abandona nuestro sistema solar en una nave espacial que viaja 
a una velocidad fija v medida con respecto a nuestro sistema solar. Se 
tiene de la teoría de Einstein que al final del tiempo £ medido desde la 
Tierra, el tiempo que habrá transcurrido en la nave espacial es únicamente 
ty 1 -- v?. Para establecer este resultado, considérense los mismos siste- 
mas de coordenadas S y S’ y los relojes C y C’ que estudiamos antes. Su- 
póngase que el origen de S’ coincide con la nave espacial y que el origen 
de S coincide con un punto en el sistema solar (estacionario con relación 
al Sol), de manera que los orígenes de S y S’ coincidan y los relojes C 
y C' den una lectura de cero en el momento en el que el astronauta 
inicia su viaje. 

Visto desde S, las coordenadas espacio-tiempo del vehículo en cual- 
quier instante £ > 0 medidas por C son 


vt 


0 


t 


mientras que vistas desde S’ las coordenadas espacio-tiempo del vehículo 
en cualquier instante f' > 0 medidas por C’ son 


0 


Pero si dos conjuntos de coordenadas de espacio-tiempo 


vt 0 
0 y 0 
0 0 


` 
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describen el mismo evento, debe tenerse que 


vt 0 
0 
T, = E 
0 0 
t 
Luego entonces 
l —Y 
VA — v? pea VA — 0?) [ot 0 
0 1 0 0 oj 0 
0 0 1 0 o] Jo 
—u l t t 
VA — v? Uee s1 — v? 


De la ecuación anterior se tiene que 


—u?t t 


— ———— a t, 10] bien 1 E ivl—. (11) 
y 1 -— o vl- 


Este es el resultado deseado. 
Una consecuencia dramática de la contracción del tiempo la propor- 
ciona el Ejercicio 9 al final de esta sección. 


Hagamos una consideración adicional. Supóngase que las unidades de 
distancia y tiempo que consideramos son unidades que se usan más común- 
mente que el segundo-luz y el segundo, tales como la milla y la hora, o 
el kilómetro y el segundo. Sea c la velocidad de la luz en las unidades 
que hayamos seleccionado para la distancia y el tiempo. Se puede ver 
fácilmente que si un objeto viaja a una velocidad v relativa a un conjunto 
de unidades, entonces viaja a una velocidad v/c en unidades de segundos- 
luz por segundo. Así, para un conjunto cualquiera de unidades de distancia 
y tiempo, la Ecuación (11) se transforma en 


A y? 


EJERCICIOS 


1. 


2. 


Demostrar los incisos (b), (c) y (d) del Teorema 7.11. 


Completar la demostración del Teorema 7.12 para el caso 1 < O. 
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3. Para 


Wi oo 


== O O = 
o 


demostrar que 
(a)  (w,, w:} es una base ortogonal para L((e,, e)). 
(b) L((e,, e,)) es T*L ,T,-Invariante. 

4. Demostrar el corolario del Teorema 7.13. 
Sugerencias: 


(a) Demostrar que 


p00 q 
B*4B, — 010 oj 
0.0 1 0 
—q 0 0 —p 
donde 
a+b a—b 


Po Y 


(b) Demostrar que q = O utilizando el hecho de que B*AB, es autoad- 
junta. 
(c) Aplicar el Teorema 7.12 a 


0 
l 
w = 
0 
1 
para demostrar que p > 1. 
5. Demostrar que 
—U 
0 WI =p? 
0 0 
T, = [Ec. (10)]. 
0 0 
l l 
s/l — y? 


Sugerencia: Utilizar una técnica similar a la que se empleó en la obtención 
de la Ecuación (7). 
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Dados tres sistemas coordenados S, S’ y S” con ejes correspondientes (x, x’, 
x"; y, y', y", y 2, 7, 2”) paralelos y tales que los ejes x, x' y x” coinciden. 
Supóngase que S’ se mueve delante de S con una velocidad v, > O (medida 
en S), S” se mueve delante de S’ con una velocidad v, > O (medida en S’) 
y S” se mueve delante de S con una velocidad v, > O (medida en $), y que 
existen tres relojes C, C’ y C” tales que C es estacionario con relación a 
S, C' es estacionario con relación a S' y C” es estacionario con relación 
a S”. Supóngase que cuando en cualquiera de los tres relojes se mide el 
tiempo cero, los orígenes de S, S' y S” coinciden. Suponiendo que Te, = T,,T., 


(esto es B., :- B,,B,,), demostrar que 
Vi + v 
V = —. 
"14 0» 


Nótese que el sustituir v, == 1 en la ecuación. anterior se obtiene v, == 1. Esto 
nos dice que la velocidad de la luz medida en S o S' es la misma. ¿Por qué 
nos sorprendería si esto no ocurriera? 


Calcular (B,)"'. Demostrar que (B,)"' = Beor. Conclúyase que si S' se 
mueve a una velocidad negativa v relativa a S, entonces [T.]g : * B., donde 
B. tiene la forma dada en el Teorema 7.14. 


Supóngase que un astronauta abandonó la Tierra en el año de 1776 y viajó 
a una estrella situada a 99 años luz de la Tierra a una velocidad de 99% 
de la velocidad de la luz, y llegando a la estrella emprendió de inmediato el 
regreso a la Tierra a la misma velocidad. Considerando la teoría especial 
de la relatividad de Einstein, demostrar que si el astronauta tenía 20 años de 
edad en el momento de su partida, regresaría a la Tierra a la edad de 48.2 
años en el año de 1976. Explicar la utilidad del Ejercicio 7 al resolver 
este problema. 


Recuérdese la nave espacial en movimiento considerada en el estudio de la 
contracción del tiempo. Supóngase que el vehículo se desplaza hacia una 
estrella fija localizada en el eje x de S a una distancia de b unidades del 
origen de S. Si la nave espacial viaja hacia la estrella a una velocidad v, 
los habitantes de la Tierra (que permanecen “casi” estacionarios con respecto 
a S) calcularán que el tiempo que le toma al vehículo alcanzar la estrella 
es t= b/v. Debido al fenómeno de contracción del tiempo el astronauta 
percibirá un tiempo de Y = tV 1 —v:= (b/v) V1 — v”. Aparece una para- 
doja en el hecho de que el astronauta percibe un tiempo inconsistente con 
una distancia b y una velocidad v. Pero la paradoja se resuelve observando 
que la distancia desde el sistema solar a la estrella medida por el astronauta 
es menor que b. 

Suponiendo que los sistemas coordenados $ y S' y los relojes C y C’ 
son los descritos en la exposición de la contracción del tiempo, 
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(a) Discutir que en el tiempo £ (medido en C) las coordenadas espacio- 
tiempo de la estrella relativas a S y C son 


b 
0 
0 


t 
(b) Demostrar que en el tiempo £ (medido en C) las coordenadas espacio- 
tiempo de la estrella relativas a S' y C’ son 


b — vt 
„s/l — v? 
0 
0 
t — bv 
a/l — y? 
(c) Haciendo 
i b— tv ; t — bv 
xX = — y U= —— 
Vli =— v? yI =v? 


demostrar que x" + by 1 =v? -- tv. 


Este resultado se puede interpretar como que en el tiempo 1 medido por el 
astronauta, la distancia del astronauta a la estrella, medida por el astro- 
nauta (ver la Fig. 7.3), es 


BVL -v — fo, 
y v A 
(x, 0, 0) 
, ; coordenadas 
C C relativas 
3 ao” 
E >=- (estrella) 
S x X 
(b, 0, 0) 
coordenadas 
relativas 
figura 7.3 a S 


(d) Conclúyase de esto que 


(i) La velocidad de la nave espacial con respecto a la estrella me- 
dida por el astronauta es v. 
(11) La distancia de la Tierra a la estrella medida por el astronauta 


esbyl -v 
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Así, las distancias a lo largo de la línea de movimiento del vehículo espa- 
cial aparecen contraídas por un factor de Y 1 — v. 


7.5 OPERADORES NORMALES Y AUTOADJUNTOS 


En esta sección demostraremos que en cualquier espacio con producto 
interior dimensionalmente finito existe una clase de operadores lineales to- 
talmente determinados por sus eigenvalores. Específicamente, para un tal 
operador lineal T, existe una base ortonormal de eigenvectores 8. Dado que 
las matrices que representan a T y T* en la base ordenada 8 son matrices 
diagonales, tales matrices conmutan; por lo tanto, la condición TT* = T*T 
se hace necesaria para la existencia de tal base 8. Demostraremos que para 
espacios complejos con producto interior esta condición también es sufi- 
ciente. 


Definiciones. Sea V un espacio con. producto interior, y sea T un operador lineal 
en V. Decimos que T es normal si TT* = T*T. Una matriz A de n x n es 
normal sí AA* = A*A. 


Nótese que si 8 es una base ortonormal finita formada por eigenvec- 
tores de T, entonces T es normal si y sólo si [T]g es normal. Por supuesto, 
cualquier matriz diagonal es normal. 

Si V no es dimensionalmente finito, entonces para que T sea normal 
es necesario que T* exista. 

Con el objeto de construir una base ortonormal de eigenvectores para 
un operador normal T, debemos demostrar primero que cualquiera de estos 
operadores tiene al menos un eigenvector. Para este resultado requeri- 
mos del siguiente teorema. 


Teorema 7.15. Sea V un espacio con producto interior, y sea T un operador 
normal en V. Entonces 
(a) [TGI = |[T*(x)|| para toda x €V. 
(b) T-— cl es normal para toda cE€F. z 
(c) Si es un eigenvalor de T, entonces A es un eigenvalor de T*. 


De hecho, T(x) = àx implica que T* (x) = AX. 
(d) Si A, y à: son distintos eigenvalores de T con eigenvectores co- 
rrespondientes X, y X., entonces X, y X: son ortogonales. 
DEMOSTRACIÓN. 
(a) Para cualquier x €V, tenemos que 


LTO) = (16), TG)) = (T*T (x), x) 
= (TT* (x), x) = (T* (x), T*(x)) = ||T* œ}. 


La demostración de (b) se deja como ejercicio. 
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(c) Sea U =T — Al y supóngase que T(x) = Ax para alguna x€V. 
Entonces U(x) = 0, y en virtud de (a) y (b) tenemos que 
0 = U = UO =|1(1* — 42069 = IT — ixl. 


Por lo tanto T*(x) = Ax. 
(d) Sean A, y Az distintos eigenvalores de T con eigenvectores corres- 
pondientes x, y x». Entonces, utilizando el inciso (c), tenemos que 
Mr(X1, X2) = (AXi, X2) = (T(x,), x2) 
= (xa, T*(x2)) F (Xi, Moxa) = A(X, X2). 


Como A, Æ Az concluimos que (x, x2) =0 El 


Corolario 1. Sea T un operador normal en un espacio con producto interior V, 


y sea B una base ortonormal para V. Entonces B está formada por eigen- 
vectores de T si y sólo si B está formada por eigenvectores de T*. 


Como se mencionó anteriormente, existe un fuerte paralelismo entre el 
complejo conjugado de un número complejo y el adjunto de un operador 
lineal. (Véase, por ejemplo, el Teorema 7.10.) Los números reales pue- 
den caracterizarse como aquellos números complejos que son iguales a sus 
complejos conjugados. Si consideramos la condición T = T* para un ope- 
rador lineal, veremos que se tienen muchas de las propiedades de los 
números reales para dichos operadores. De hecho, veremos (en el Ejer- 
cicio 5) que todo operador puede escribirse en la forma T, + iT, donde 
Tı y T, satisfacen la condición anterior. Asimismo, todos estos operadores 
tienen únicamente eigenvalores reales. 


Definiciones. Sea V un espacio con producto interior, y sea T un operador lineal 


en V. T se denomina operador autoadjunto (o Hermitiano) si T = T*. Una 
matriz A de n x n es autoadjunta (o Hermitiana) si A = A*. 


Así, para el caso de matrices reales, ser autoadjunta equivale a ser 
simétrica. 

Es fácil ver que si 8 es una base ortonormal finita para V, entonces T 
es autoadjunto si y sólo si [T]¿ es autoadjunta. 

Nótese también que cualquier matriz diagonal que tenga al menos un 
elemento no real es normal pero no autoadjunta. Por supuesto, las matrices 
autoadjuntas son normales. 


Ejemplo 20. Sea V = R?; entonces V = W, @ W,, donde W, = L({(1, 
1))) y W: = L({(0, 1)}). Sea T la proyección en W, tal que N(T) = W,; 
esto es, T(a, b) = (a, a). Si B = {e,, e}, entonces 


a=m=(1 o) 
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1 1 
* = 
at= (o 0) 


un cálculo sencillo muestra que A4* 4 A*A. Así pues, T no es ni auto- 
adjunto ni normal. 


Dado que 


Veremos en la Sección 7.5 que un tipo especial de proyección T, llama- 
da “proyección ortogonal” (la que tiene la propiedad de que R(T) = N(T)}, 
es siempre autoadjunta. 


Corolario 2. Sea T un operador lineal autoadjunto en un espacio con producto 
interior V. Si A es un eigenvalor de T, entonces A es un número real. 


DEMOSTRACIÓN. Sea x un eigenvector correspondiente al eigenvalor A. 
Por el inciso (c) del teorema anterior tenemos que 


Ax = T(x) = T*(x) = ax. 


Como x 4 0, tenemos que A = A; por lo tanto A es real. W 


En el Teorema 7.16 demostraremos que una cierta clase de operador 
lineal posee siempre un eigenvalor. 

El lector observará que las hipótesis de este teorema están divididas 
en dos casos, F = R y F = C. La razón de esto se hará evidente en el 
punto de la demostración donde deseemos obtener un cero del polinomio 
característico, ya que, aunque muchos polinomios de valor real no tienen 
ceros (reales), el teorema fundamental del álgebra (Apéndice D) garan- 
tiza este resultado para los polinomios de valor complejo. 


Teorema 7.16. Sea V un espacio vectorial dimensionalmente finito sobre F, 
y sea T un operador lineal en V. 


(a) Si V es un espacio vectorial complejo (esto es, si F = C), en- 
tonces T tiene un eigenvalor. 

(b) Si V es un espacio real con producto interior (o sea, si F = R) 
y T es autoadjunto, entonces T tiene un eigenvalor (real). 


DEMOSTRACIÓN. Supóngase que dim(V) = n, y sea f el polinomio carac- 
terístico de T. 


(a) Si F =C, entonces el teorema fundamental del álgebra garanti- 
za que f tiene un cero. Por tanto, T tiene un eigenvalor. 

(b) Si V es un espacio real con producto interior, sea 8 una base 
ortonormal para V. Entonces A = [T]ę es autoadjunta y tiene elementos 
reales. 


Defínase a Ta: Œœ — C” mediante T,(x) = Ax. De (a) se tiene que 
Ta tiene un eigenvalor A. Como la matriz de T, en la base ordenada están- 
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dar para C” es A, tenemos que T, es autoadjunto y, por lo tanto, según 
el Corolario 2 del Teorema 7.15, A es real. Luego entonces, el polinomio 
f(t) = det(A — tI) tiene el cero real A y entonces T tiene al eigenva- 
lor A. B 


Teorema 7.17(C). Sea V un espacio con producto interior, complejo y dimen- 


sionalmente finito, y sea T un operador lineal en V. Entonces T es normal 
si y sólo si V tiene una base ortonormal formada por eigenvectores de T. 


Teorema 7.17(R). Sea V un espacio con producto interior, real y dimensional- 


mente finito, y sea T un operador lineal en V. Entonces T es autoadjunto 
si y sólo si V tiene una base ortonormal formada por eigenvectores de T. 


DEMOSTRACIÓN. Supondremos primero que T es o normal o autoadjunto 
y luego obtendremos la base ortonormal adecuada. La demostración se hará 
por inducción sobre n = dim(V). 


Si n= 1, entonces V = L((x)) para alguna x +0. En este caso es 
obvio que ((1/|[x||)x) es una base ortonormal formada por un eigen- 
vector de T. 

Ahora supóngase que el resultado es cierto para operadores normales 
[autoadjuntos] en espacios con producto interior de dimensión n— 1. 
Demostraremos que el resultado es cierto para el operador T en V. 

Por el Teorema 7.16, T tiene un eigenvalor A,; sea x, un eigenvector 
asociado. Supondremos que ||x,|| = 1. Sea W = L({x,}). De acuerdo con 
el Teorema 7.15, x, es también un eigenvector de T*, de manera que evi- 
dentemente W es T- y T*-invariante. Por el Ejercicio 6, WŁ es también 
T- y T*-invariante; por tanto, por el mismo ejercicio, Ty- es normal [auto- 
adjunto] puesto que T lo es. Del Corolario 2 del Teorema 7.6 tenemos 
que dim (W+) = n — 1. Por lo tanto, podemos aplicar la hipótesis de induc- 
ción a Ty para producir una base ortonormal (x.,... , x,) para W+ 
formada por eigenvectores de Tw- y, por lo tanto, de T. Se infiere fácil- 
mente (x,, ... , Xa} es la base ortonormal para V deseada. 

La primera parte de la demostración, que es la más difícil, queda ter- 
minada. Ahora supongamos que (x,,... , Xa} es una base ortonormal 
formada por eigenvectores de T con T(x;¡) = Aix; para I <i<n. 

Si V es un espacio complejo con producto interior, entonces por el 
Teorema 7.15 


(TT*)(x;) = T(A,x;) = A:T (x;) = Aih: X; = |A Px, para I <i<n. 


Análogamente, 
(TD) (x) = A; xi para 1 <<i<n. 


Por lo tanto, T es normal. 
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Por otra parte, si V es un espacio real con producto interior, entonces 
à; es real para 1 < i < n. Así, 


T(x) = Aix: = Aixi = T* (x) para 1<i<n 
y, por lo tanto, T es autoadjunto. MW 


Con el objeto de ver por qué la condición de normalidad en un espacio 
real con producto interior no es suficiente para garantizar ni siquiera un 
eigenvector, basta con que consideremos las rotaciones. Sea 0 < 9 < 7 y 
defínase a T; R?— R? como la rotación en un ángulo 6. La matriz de T 
en la base ordenada estándar es 


A= cos Y Tng) 
sen 6 cos 0j’ 


Es fácil ver que AA4* = 1 = A*A pero que A + A*. Es geométricamente 
evidente que tal rotación no tiene eigenvectores. 

Concluiremos esta sección con un ejemplo de un operador normal en 
un espacio complejo con producto interior que ¡no tiene eigenvectores! 
Así pues, la hipótesis de que V sea dimensionalmente finito es crucial en 
el Teorema 7.17(C), así como en el Teorema 7.16. 


Ejemplo 21. Considérese el espacio con producto interior H anterior- 
mente definido, y sea x, = e'*. Supóngase que V = L((xz: k es un en- 
tero)). Evidentemente 8 = (x,: k es un entero) es una base ortonormal 
de V. Selecciónense ahora operadores lineales F y U en V tales que 
T(xx) = Xx y U(Xx) = Xy, para todo entero k. Entonces 


(Ti), x) = (Xin, X) = Bios T big- 
= (Xi, Xj) = (xi, U(x;)). 


Se infiere que U = T*. Además, TT* = | = T*T y entonces T es normal 
Para cualquier elemento x €V tenemos que 


k 
x= aixi 
i=-k 
para alguna k y escalares a;, y entonces 
k 
N T(x) = È aiXin 
i=-k 


Como £ es independiente, se infiere que T no tiene eigenvectores. 
La condición de que TT* = | = T*T, la cual apareció en los últimos dos 
ejemplos, será considerada en la sección siguiente. 
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EJERCICIOS 


Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
los espacios con producto interior subyacentes son dimensionalmente finitos. 


(a) Todo operador autoadjunto es normal. 

(b) Los operadores tienen los mismos eigenvectores que sus adjuntos. 

(c) Si T es un operador en un espacio con producto interior V, entonces 
T es normal si y sólo si [T]g es normal, donde ß es cualquier base 
ordenada para V. 

(d) Una matriz A es normal si y sólo si L, es normal. 

(e) Los eigenvalores de un operador autoadjunto deben ser todos reales. 

(£) Los operadores identidad y nulo son autoadjuntos. 

(g) Todo operador normal es diagonalizable. 

(h) Todo operador autoadjunto es diagonalizable. 


Para cada uno de los siguientes operadores lineales, determinar si son 
normales, autoadjuntos o ninguno de los dos. 


(a) T: R?— R? definido mediante Tía, b) = (2a — 2b, —2a + 5b) 
(b) T: CŒ — CŒ definido mediante T(a, b) = (2a + ib, a + 2b) 
(c) yT: Pa(R)—>P.(R) definido mediante TH =f. 


Para el inciso (a), encontrar una base ortonormal para R* formada por 
eigenvectores de T. 


Sean T y U operadores autoadjuntos en un espacio “con producto interior. 
Demostrar que TU es autoadjunto si y sólo si TU:= UT, 


Demostrar el inciso (b) del Teorema 7.15. 


Sea V un espacio complejo con producto interior, y sea T un operador lineal 
en V. Defínase 


1 1 
== +T T: = —(T — T*). 
1550 tT) y T Ta ) 


(a) Demostrar que T, y T, son autoadjuntos y que T = T, + iT.. 

(b) Suponer también que T = U, + iU», donde U, y U, son autoadjuntos. 
Demostrar que U, = T, y U. = T.. 

(c) Demostrar que T es normal si y sólo si T,T. = T.T,. 


Sea T un operador lineal en un espacio con producto interior V, y sea W 
un subespacio T-invariante de V. Demostrar las cuestiones siguientes. 


(a) Si T es autoadjunto, entonces también Ty lo es. 
(b) W es T*-invariante. 


10. 


11. 


12. 
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(c) SiW es T- y T*-invariante, entonces (Ty)* = (T*)w. 
(d) Si W es T- y T*-invariante y T es normal, entonces Tw es normal. 


Sea T un operador normal en un espacio complejo con producto interior 
dimensionalmente finito V, y sea W un subespacio de V. Demostrar que si 
W es T-invariante, entonces W es también T*-invariante. Sugerencia: Utili- 
zar el Ejercicio 10(d) de la Sección 5.4. 


Sea T un operador normal en un espacio con producto interior dimensio- 
nalmente finito V. Demostrar que N(T) = N(T*) y R(T) = R(T*). Suge- 
rencia: Utilizar el Teorema 7.15 y el Ejercicio 12 de la Sección 7.3. 


Sea T un operador autoadjunto en un espacio con producto interior dimen- 
sionalmente finito V. Demostrar que para toda x €V 


IT) = ixl? = [1100 ]* + [lxi]. 
Deducir que (T — il) es invertible y que [(T — il)~]* = (T + il)~. 


Supóngase que T es un operador lineal en un espacio complejo con producto 
interior (no necesariamente dimensionalmente finito) V con un adjunto T*. 
Demostrar que 


(a) Si T es autoadjunto, entonces (T(x), x) es real para toda x €V. 

(b) Si T satisface a (T(x), x) = O para toda x €V, entonces T = To. 
Sugerencia: Sustituir a x por x t y y luego por x + iy y expándan- 
se los productos interiores resultantes. 

(c) Si (T(x), x) es real para toda x €V, entonces T = T*, 


Sea A una matriz real de n x n. Se dice que A es una matriz Gramiana si 
existe una matriz real B (cuadrada) tal que A = B'B. Demostrar que A 
es una matriz Gramiana si y sólo si Æ es simétrica y todos sus eigenvalores 
son no negativos. Sugerencia: Aplicar el Teorema 7.17(R) a L, para 
obtener una base ortonormal (x,, ... , x,) de eigenvectores con los eigen- 
valores asociados àj, ... , An. 


Sea T un operador autoadjunto en un espacio con producto interior n-di- 
mensional V, y sea A = [T]g, donde 8 es una base ortonormal para V. 
Se dice que T es definido [semidefinido] positivo si (T(x), x) > 0 para toda 
x40[(T(x), x) > 0 para toda x]. Demostrar 


(a) T es definido [semidefinido] positivo si y sólo si todos sus eigenvalores 
son positivos [no negativos]. 


(b) Tes definido [semidefinido] positivo si y sólo si L, también lo es. 
(c) T es definido positivo si y sólo si 


S A;¡a,1a, > U para todas las n-adas no nulas (a, ... , aa). 


i,j 
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(d) T es semidefinido positivo si y sólo si A es una matriz Gramiana (tal 
como se definió en el Ejercicio 11). 


La composición de dos operadores definidos positivos ¿es definido positivo? 


Diagonalización simultánea. 


(a) Sea V un espacio con producto interior, real y dimensionalmente fini- 
to, y sean U y T operadores autoadjuntos en V tales que UT = TU. 
Demostrar que existe una base ortonormal para V formada por vec- 
tores que son eigenvectores de U y de T. (La versión compleja de 
este resultado aparece como el Ejercicio 10 de la Sección 7.9.) Suge- 
rencia: Para cualquier eigenespacio W = E, de T tenemos que W 
es T- y U-invariante. Por el Ejercicio 6 tenemos que WŁ es T- y U-in- 
variante. Aplicar el Teorema 7.17(R) y el Teorema 7.6. 

(b) Enunciar y demostrar los resultados análogos acerca de matrices si- 
métricas (reales) conmutativas. 


Sea T un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Demostrar lo siguiente. 


(a) SiB =(x,,..., Xn} es una base ordenada para V, entonces [T]¿ es 
triangular superior si y sólo si T(x;) €EL(([x,, ..., x¡)) para j= 
— E 


(b) Si V es un espacio complejo con producto interior, entonces existe 
una base ortonormal y para V tal que [T], es triangular superior. 
Sugerencia: Utilizar inducción sobre n = dim(V). Escójase un eigen- 
vector x de T* y sea W = L((x)). Aplíquese la hipótesis de induc- 
ción a Wt que, de acuerdo con el Ejercicio 6(b), es T-invariante. 

(c) Toda matriz compleja A es similar a una matriz triangular superior. 


Demostrar el teorema de Cayley-Hamilton para una matriz compleja A de 
n x n; esto es, si f es el polinomio característico de A, demostrar que 
f(A) = 0. Sugerencia: De acuerdo con el inciso (c) del Ejercicio 14, 
demostrar que es posible suponer que A es triangular superior, en cuyo caso 


O, = tl (A; e t). 


Ahora bien, si T = La, tenemos que (4;l — TD (x) ELUX, -.. >, Xap, 
donde [x,, ... , Xa} es la base ordenada estándar para C". 


EL CONDICIONAMIENTO Y EL COCIENTE DE RAYLEIGH 
En la Sección 3.4 estudiamos técnicas específicas que nos permitieron re- 


solver sistemas de ecuaciones lineales de la forma AX = b donde A es 
una matriz de m x n y b es un vector de m x 1. Tales sistemas surgen 
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a menudo en las aplicaciones a la vida real. Los coeficientes del sistema 
se obtienen a partir de datos experimentales y en muchos casos m y n 
son tan grandes que es necesario utilizar una computadora para obtener 
la solución. Así pues, debemos considerar dos tipos de errores. Primero, 
hay errores experimentales que surgen en la recopilación de la información 
puesto que ningún instrumento puede permitir realizar medidas totalmente 
exactas. Segundo, las computadoras introducirán errores de redondeo. In- 
tuitivamente se puede sentir que cambios relativamente pequeños en los 
coeficientes del sistema provocarán errores relativamente pequeños en la 
solución. Un sistema que tiene esta propiedad se denomina bien condicio- 
nado; de lo contrario el sistema se llama pobremente condicionado. 

Consideraremos ahora algunos ejemplos de estos tipos de errores, con- 
centrándonos principalmente en los cambios en b más bien que en los 
cambios de los elementos de A. Además, supondremos que A es cuadrada, 
compleja (o real) e invertible puesto que este es el caso que se encuentra 
con más frecuencia en las aplicaciones. 


Ejemplo 22. Considérese el sistema 


xtX 
Xi — XA» 


3 
2): 
Ahora supóngase que cambiamos un poco al sistema y considérese el nue- 
vo sistema 
XA +x=5 
Xx — x, = 1.0001. 
Este sistema modificado tiene la solución 
3.00005 
1.999957 
Vemos que una modificación de 10-* en uno de los coeficientes ha modi- 


ficado en menos de 104 a cada una de las coordenadas de la nueva 
solución. Más generalmente, el sistema 


Xx x=5 
Xx =1+8 


|! 
=w 


il 


La solución del sistema será 


tiene como solución a 
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Por lo tanto, pequeños cambios en b introducen pequeños cambios en la 
solución. Por supuesto, estamos realmente interesados en los “cambios 
relativos” puesto que un cambio en la solución de, por ejemplo, 10 se 
considera grande si la solución original es del orden de 10- pero pequeño 
si la solución original es del orden de 10". 


Introduciremos la notación 8b para representar al vector b’ — b, donde 
b es el vector del sistema original y b’ es el vector del sistema modificado. 
Así, en el Ejemplo 22, tenemos que 


a) AE) 


Definiremos ahora el cambio relativo en b como el escalar Ssb'i/ b”, 
donde |'*|! denota la norma estándar en C" (o R°); esto es Hib o= 
= V(b, b). La mayor parte de lo que sigue, sin embargo, es cierto para 
cualquier norma. Definiciones semejantes se cumplen para el cambio rela- 
tivo en x. Así, en el Ejemplo 22, 

19| 


186) dôl, y ja le am) G] ie 
X 


lA a 


De manera que el cambio relativo en x es igual, coincidentemente, al 
cambio relativo en b y, por lo tanto, el sistema está bien condicionado. 
Ejemplo 23. Considérese el sistema 


x + ES 
= + 1.00001x, = 3.00001, 


el cual tiene a 
2 
l 
como solución. La solución para el sistema relacionado 


Xx, + X =3 
xı + 1.00001x, = 3.00001 + 5 


es 
G — (107) 
1 + (10%)8 )” 
Por lo tanto, 


l| ôx || 


Ilx 


= (v 7) 1036] > 10*/9), 
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mientras que 


ilèb|| _ iê] 

mw S 
Tenemos que el cambio relativo en x es al menos ¡10* veces el cambio 
relativo en b! El sistema está muy pobremente condicionado. Obsérvese 
que las líneas rectas definidas por las dos ecuaciones de este sistema son 
casi coincidentes, de modo que una pequeña modificación en cualquiera 
de las rectas alteraría en gran medida el punto de intersección, esto es, 
la solución del sistema. 


Para aplicar toda la fuerza de la teoría de las matrices autoadjuntas 
al estudio del condicionamiento, necesitamos tener la noción de norma de 
una matriz. (Ver Ejercicio 22 de la Sección 7.1 para otros resultados 
sobre normas.) 


Definición. Sea A una matriz compleja (o real) de n x n. Definase la norma 
(Euclidiana) de A mediante 
|IAx]| 


A mar 


donde x €C (o R»). 


Vemos intuitivamente que ||4|! representa la “ampliación máxima de 
un vector mediante la matriz A. 

La cuestión si este máximo existe o no, así como el problema de 
cómo calcularlo, serán resueltos por medio del llamado “cociente de Ray- 


leigh”. 


Definición. Sea B una matriz autoadjunta de n x n. El cociente de Rayleigh 
para x + 0 se define como el escalar R(x) = (Bx, x)/|!x]!?. 


Teorema 7.18. Para una matriz autoadjunta B tenemos que max R(x) es el 

mayor eigenvalor de B y min R(x) es el mínimo eigenvalor de B. 
x*0 
DEMOSTRACIÓN. Por el Teorema 7.17 podemos seleccionar una base orto- 
normal (x,,... , Xn} de eigenvectores de B tales que Bx; = ixi, l < 
< i< n, donde A, > A: >... > An. (Recuérdese que, por el Corolario 2 
del Teorema 7.15, los eigenvalores de B son reales.) Ahora bien, para 
xEC" (o R") existen escalares a,, ... , a, tales que 
AE 5 aiX;; 


tei 
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por lo tanto 


(Bx, x) (È ax $ ax) Sala 2 lar 


ar IP MMS 


R(x) = Aie 


Es fácil ver que R(x,) = A, por lo que, con esto, hemos demostrado 
la primera mitad del teorema. La segunda mitad se demuestra de una 
manera semejante. W 


Corolario 1. Para cualquier matriz cuadrada A, Al! es finita y, de hecho, es 


Lema. 


igual a Và, donde à es el mayor eigenvalor de A*A. 


DEMOSTRACIÓN. Sea B la matriz autoadjunta A*A, y sea A el mayor eigen- 
valor de B. Como, para x 0, 


I Ax|[? _ (Ax, Ax) _ (A*Ax, x) _ (Bx, x) 
xP IP Lap ar 


= R(x), 
tenemos del Teorema 7.18 que ||A| =à. E 


Obsérvese que la demostración del Corolario 1 muestra que todos los 
eigenvalores de A*A son no negativos. Para el siguiente corolario nece- 
sitamos del lema siguiente. 


Para cualquier matriz cuadrada A, à es un eigenvalor de A*A si y sólo 
si A es un eigenvalor de AA*. 


DEMOSTRACIÓN. Sea A un eigenvalor de A*A. Si à = 0, entonces A*A 
no es invertible. Por lo tanto, A (y A*) no es invertible, de manera que 
A es también un eigenvalor de 44*. La prueba de la recíproca es se- 
mejante. 


Supóngase ahora que A 4 0. Entonces existe x 4 0 tal que A*Ax = 
= Ax. Aplicando A a ambos lados tenemos que (AAF)(Ax) = A(Ax). 
Como Ax +0 (pues de lo contrario Ax = 0), tenemos que A es un eigen- 
valor de A4*. La recíproca se deja como ejercicio. MH 


Corolario 2. Sea A una matriz invertible. Entonces NA] = 1/ Và, donde à 


es el eigenvalor más pequeño de A*A. 


DEMOSTRACIÓN. Haremos uso de la observación de que à es un eigen- 
valor de una matriz invertible si y sólo si A”! es un eigenvalor de su 
inversa. 


Ahora bien, sean à, >A:>... >A, los eigenvalores de A*A, los 
cuales, por el lema, son los eigenvalores de A4*. Entonces A ' = es igual 
al mayor eigenvalor de (4 ')*4' = (4A4*)”, el cual es igual a 1/A,. B 
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Para muchas aplicaciones, únicamente los eigenvalores mayor y menor 
son de interés. Por ejemplo, en el caso de los problemas de vibración, el 
eigenvalor más pequeño representa la mínima frecuencia a la que las vibra- 
ciones pueden ocurrir. 

Veremos el papel de ambos eigenvalores en nuestro estudio de condi- 
cionamiento. 


Ejemplo 24. Sea 


Entonces 


l 12 
Los eigenvalores de B son 3, 3 y 0. Por tanto, ||4]| = v 3. Para cualquier 
a 
x=|b1|x%0, 
c 
podemos calcular R(x) para la matriz B como 
(Bx, x)  2R(Œœ + bP + œ -— ab + ac + bc) 


R A A E A A 
3 2 (x) TE aè + b: + c 


para toda a, b, CER. 


Ahora que sabemos que ||4|| existe para toda matriz cuadrada, utiliza- 
remos la desigualdad ||4x|| < |[4]|- ixl, la que se cumple para toda x. 

Supóngase, para lo que sigue, que A es invertible, b 40 y Ax = b. 
Para una 3b dada, sea 3x el vector que satisface a A(x + 8x) = b + ôb. 
Entonces A (8x) = 8b, y así 8x = A7 (8b). Por lo tanto, 


1611 =114x11 SIA y 11óx ll =1147'(6b) [1 < 11.47? 11-110511. 


Así, tenemos que 


[8x1 1141-11861-11.4]1 — -i (11851. 
e ad y Crew) 


De una manera análoga, 


11811N — 1Sx1L 
raro) E 1 


El número ||4]|- || A|] se llama número condicional de A y se denota 
por cond(A). Debe hacerse notar que la definición de cond(4) depende 
de cómo definimos la norma de 4. Existen muchas maneras razonables de 
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definir la norma de una matriz. De hecho, la única propiedad que utili- 
zamos para establecer las desigualdades anteriores fue que '!Axji < '1A|| 
'I- xl] para toda x. Resumamos lo anterior con el teorema siguiente. 


Teorema 7.19. Para el sistema Ax = b donde A es invertible y b 0, tene- 
mos los dos resultados siguientes: 


1 _ |lôb]| — |19x]| || ðb || IS 
onda) bl © Tix a e So VERT 
=r fhi i 
(b) cond(A) =,/ 7 donde A, y à: son los eigenvalores mayor y 


menor, respectivamente, de A*A. (En este inciso suponemos que 
|- || es la norma Euclidiana, definida en esta sección.) 


DEMOSTRACIÓN. El enunciado (a) se obtiene de las desigualdades ante- 
riores y el (b) de los Corolarios 1 y 2 del Teorema 7.18. E 


Del Teorema 7.19 es claro que cond(4) > 1. Se deja como ejercicio 
demostrar que cond(A)'= 1 si y sólo si 4 es un múltiplo escalar de una 
matriz “unitaria” u “ortogonal”, definida en la Sección 7.7. Además, pue- 
de demostrarse con algo de trabajo que en el inciso (a) se puede obtener 
la igualdad mediante una elección adecuada de b y 8b. 

Podemos darnos cuenta de inmediato del inciso (a) que si cond(4) 
se aproxima a 1, entonces estamos seguros que un error relativo pequeño 
en b obliga a un error relativo pequeño en x. Si cond(4) es grande, sin 
embargo, entonces el error relativo en x puede ser pequeño, aun cuando 
el error relativo en b sea grande, o bien el error relativo en x puede ser 
grande, ¡aun cuando el error relativo en b sea pequeño! En pocas palabras, 
cond(4) indica únicamente el potencial para errores relativos grandes. 

Hasta ahora hemos considerado únicamente errores en el vector b. Si 
existe un error 84 en la matriz de los coeficientes del sistema AX = b, 
la situación es más complicada. Por ejemplo, A + 34 puede dejar de ser 
invertible. Pero puede demostrarse bajo consideraciones adecuadas que se 
puede dar una cota para el error relativo en x en términos de cond(4). 
Por ejemplo, si A + 84 es invertible, Forsythe y Moler (Forsythe, George 
y Moler, Cleve B., Computer Solution of Liner Algebraic Systems, Pren- 
tice Hall, Inc., 1976, p. 23), demuestran que 


E da AC 
ax + sxi! y 
Debería mencionarse que, en la práctica, casi nunca se conoce cond(4), 
puesto que sería un gasto innecesario de tiempo calcular A~ simplemente 
para determinar la norma. De hecho, si se utiliza una computadora para 
encontrar 4”, la inversa de A así calculada únicamente se aproximará a 
A ' y el error en la inversa calculada se verá afectado por la magnitud 
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de cond(A). ¡Y así caemos en un círculo vicioso! Existen, sin embargo, 
algunas situaciones en las cuales se puede encontrar una aproximación 
utilizable de cond(4). Así pues, en la mayor parte de los casos, la esti- 
mación del error relativo en x se basa en la estimación de cond(4). 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Si AX = b está bien condicionada, entonces cond(A4) es pequeño. 

(b) Si cond(A4) es grande, entonces AX = b está pobremente condicio- 
nada. 

(c) Si cond(A) es pequeño, entonces AX = b está bien condicionada. 

(d) La norma de A es igual al cociente de Rayleigh. 

(e) La norma de A es siempre igual al mayor eigenvalor de A. 


Calcular las normas de las matrices siguientes. 


E a 


Ofi AH 0 
e 

0 55 

o 2 ı 


Demostrar que si B es simétrica, entonces |'B!| es el mayor eigenvalor 
de B. 


Sean A y A” las siguientes: 


6 B -17 6 —4 1 
A=| 13 29 -38) y a4r=l[-4 11 7). 
-17 —38 50 -1 75 


Los eigenvalores de A son aproximadamente 84.74, 0.2007 y 0.0588. 


(a) Aproximar ¡A , A: y cond(4). (Obsérvese el Ejercicio 3 ante- 
rior.) 

(b) Supóngase que tenemos vectores x y í tales que Ax = b y Ub — Ar 
< < 0.001. Utilizar (a) para determinar las cotas superiores para 
j¥ — A"'b- (el error absoluto) y ['í — A“'bi'/||A7'b'' (el error rela- 
tivo). 


Supóngase que x es la verdadera solución de AX = b y que una computado- 
ra llega a una solución aproximada *. Si cond(4) = 100, ib! = 1 y 'b— 
— AX¡| = 0.1, obtener cotas superior e inferior para lx — Xx '/Ux!. 
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— LD = 
LN 


Calcular 


l 
e(-2) B| y cond(B). 
3 


Sea B una matriz simétrica. Demostrar que min R(x) es igual al eigenva- 


C 0 


lor más pequeño de B. 


Demostrar que si A es un eigenvalor de 44*, entonces A es un eigenvalor 
de A*A. Esto completa la demostración del lema del Corolario 2 del 
Teorema 7.18. 


Demostrar la desigualdad izquierda de (a) en el Teorema 7.19. 


Demostrar que cond(4) = 1 si y sólo si A es un múltiplo escalar de una 
matriz unitaria u ortogonal, tal como ésta se define en la Sección 7.7. 


(a) 


(b) 


(c) 


Sean A y B matrices cuadradas unitariamente equivalentes, tal como 
se definen en la Sección 7.7. Demostrar que ||A]| = lIB|]. 
Sea V un espacio con producto interior dimensionalmente finito, y sea 
T un operador lineal en V. Defínase 
! ! 
¡Ej = max AAA! 

szo Ho! 
Demostrar que IIT = |'[T]¿'|, donde 8 es cualquier base ortonormal 
de V. 
Sea V un espacio dimensionalmente finito con producto interior y con 
una base ortonormal (x,, xX», ...). Sea T el operador lineal en V tal 
que T(x) = kxx. Demostrar que |/T': (definido en (b)) no existe. 


OPERADORES UNITARIOS Y ORTOGONALES 
Y SUS MATRICES 


En esta sección continuaremos nuestra analogía entre los números comple- 
jos y los operadores lineales. Recordemos que el complejo conjugado de 
un número complejo actúa de una manera semejante al adjunto de un 
operador lineal. (Véase, por ejemplo, el Teorema 7.10.) Un número com- 
plejo z tiene una longitud de 1 si zz = 1. En esta sección estudiaremos 
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a aquellos operadores lineales T en un espacio vectorial V tales que TT* = 
= T*T = |. Veremos que éstos son justamente los operadores lineales que 
“preservan la longitud” en el sentido de que !||T(x)|| = ||x|| para toda 
x € V. También demostraremos que, en un espacio complejo con producto 
interior, dimensionalmente finito, éstos son los operadores normales cuyos 
eigenvalores tienen todos un valor absoluto de 1. 

En capítulos anteriores estuvimos interesados en estudiar aquellas fun- 
ciones que conservan la estructura del espacio subyacente. En particular, 
los operadores lineales conservan las operaciones de suma vectorial y de 
multiplicación por escalares y los isomorfismos conservan toda la estruc- 
tura del espacio vectorial. Es ahora normal considerar aquellos operadores 
lineales T en un espacio con producto interior que conservan la longitud; 
es decir, T (x)| = |lxl' para toda x. Veremos que, de hecho, esta condi- 
ción garantiza que T preserva el producto interior. 


Definiciones. Sea V un espacio con producto interior (sobre F), y sea T un ope- 
rador lineal en V. Si UTGO'| = ||x!! para toda xEV, llamamos a T un 
operador unitario si F = C y un operador ortogonal si F = R. 


Evidentemente, cualquier rotación o reflexión en R* preserva la longi- 
tud y, por lo tanto, es un operador ortogonal. Estudiaremos en la próxima 
sección a estos operadores con mucho más detalle. 


Ejemplo 25. Sea V = H y sea h €V con [h(x)| = 1 para toda x. Defínase 
a T: V—>V mediante T(f) = hf. Entonces 


o 1 +7 IFR oa 
IT) = Jaf* = zf AOHOR(OFO dt = (|f11 
por el hecho de que |A(t)i* = 1 para toda 1. Por tanto, T es un operador 
unitario. 


Teorema 7.20. Sea V un espacio con producto interior, dimensionalmente finito, 
y sea T un operador lineal en V. Entonces son equivalentes las siguientes 
condiciones. 


(a) TI*=T*T=1, 

(b) (T(x), T(y)) = (x, y) para toda x, y EV. 

(c) Si B es una base ortonormal para V, entonces T(8B) es una base 
ortonormal para V. 

(d) Existe una base ortonormal ß para V tal que T(R) es una base 
ortonormal para V. 

(e) T(x): = x para toda x EV. 


Por lo tanto, todas las condiciones anteriores son equivalentes a la defi- 
nición de un operador unitario u ortogonal. De (a) se deduce que todo 
operador unitario u ortogonal es normal. 


434 


Lema. 


Espacios con producto interior 


Antes de probar el teorema, primero demostraremos el siguiente lema. 
Compárese éste con el Ejercicio 10(b) de la Sección 7.5. 


Sea V un espacio con producto interior, dimensionalmente finito, y sea 
U un operador autoadjunto en V. Si (x, U(x)) = O para toda x €V, enton- 
ces U = To. 


DEMOSTRACIÓN. Por el Teorema 7.17 podemos escoger una base ortonor- 
mal 8 de eigenvectores de U. Si xE ff entonces U(x) = Ax para alguna A. 
Entonces 


O = (x, U(x)) = (x, Ax) = A(x, x), 


y à = 0. Por lo tanto, U(x) = O para toda x € £ y, finalmente, U = To. $ 


DEMOSTRACIÓN DEL TEOREMA 7.20. Primero demostraremos que (a) im- 
plica a (b). 

Sea x, y €V. Entonces (x, y) = ((T*T) (x), y) = (T(x), T(y)). 

En segundo lugar, demostraremos que (b) implica a (c). Sea 8 = 
= (Xi, ... , Xn} una base ortonormal para V. Entonces T(B) = {T(x,). 
---, T(x,)). Ahora bien, (T(x:), T(x;)) = (x;, xj) = 8;;. Así, T(B) es 
una base ortonormal de V. 

El que (c) implica a (d) es evidente. 

Ahora demostraremos que (d) implica a (e). Sea x€V y sea 8 = 
= (Xi, ... , Xn}. Tenemos que 


n 
x= SY aixi 


ist 


para algunos escalares a, y entonces, como f es ortonormal, 


n n n n 2 n n rs n 
Ixe = (Lazo E ax) = È Haza, x) = È D aadu = Ear 


i=1 ¡= i=l j 
Haciendo las mismas operaciones a 
n 
T(x) = 2 aT (x) 
dt=1 
y utilizando el hecho de que T(f) también es ortonormal, obtenemos 
ITD = 2 fa,[”. 
tol 
Por tanto T(x) = lx! 


Finalmente, demostraremos que (e) implica a (a). Para cualquier 
x EV tenemos que 


(x) = ixl = T = (160, T(x)) = (x, (T*T)(x)). 
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Así, (x, (I — T*T)(x)) = 0 para toda x€V. Sea U = | — T*T; entonces 
U es autoadjunta y (x, U(x)) = O para toda x €V. Luego, de acuerdo con 
el lema, tenemos que T, = U = | — T*T y por lo tanto T*T = |. Así pues, 
como V es dimensionalmente finito, T* = T- y entonces TT* = |. MW 


De la definición se infiere directamente que el valor absoluto de todo 
eigenvalor de un operador unitario u ortogonal es 1. De hecho, algo más 
es cierto. 


Corolario 1. Sea T un operador lineal en V un espacio real dimensionalmente 
finito con producto interior. V tiene una base ortonormal de eigenvectores 
de T con eigenvalores correspondientes de valor absoluto 1 si y sólo si T 
es autoadjunto y ortogonal. 


DEMOSTRACIÓN. Supóngase que V tiene una base ortonormal (X,, ..., Xn) 
tal que T(x;) = Aix; y JAi] = 1 para toda i. Por el Teorema 7.17(R), T 
es autoadjunto. Entonces (TT*Xx,) = T(A,x,) = Adix; = Ax; = X; para 
cada i, de modo que TT* = | y por el inciso (a) del Teorema 7.20, T es 
ortogonal. 


Si T es autoadjunto, entonces por el Teorema 7.17(R) tenemos que V 


posee una base ortonormal (x,, ... , Xn) tal que T(x:) = Aix; para toda i. 
Como T es ortogonal, tenemos que |4,| - Ixl] = Axl = TEI = Ixl, 
y entonces |à;| = 1 para cada i. W 


Corolario 2. Sea T un operador lineal en V un espacio complejo dimensional- 
mente finito con producto interior. Entonces, V tiene una base ortonormal 
de eigenvectores de T con eigenvalores correspondientes cuyo valor abso- 
luto es 1 si y sólo si T es unitario. 


DEMOSTRACIÓN. La demostración es semejante a la del Corolario 1. MW 


Ejemplo 26. Sea T: R?— R? una rotación por 9, donde O < 9 < v. Es 
geométricamente evidente que T “preserva la longitud”, esto es que ''T(x)!| 
H! = xl] para toda x€R*. El hecho de que las rotaciones por un ángulo 
fijo conservan la perpendicularidad no sólo puede verse geométricamente, 
sino que ahora se infiere del inciso (b) del Teorema 7.20. Probablemente 
el hecho de que tal transformación preserve el producto interior no sea tan 
evidente geométricamente; sin embargo, este hecho lo obtenemos también 
a partir de (b). Finalmente, una inspección de la matriz 


cosg  —sen 6 
sen 0 cos Y 
revela que T no es autoadjunto para la restricción dada para 6. Como ya 


lo mencionamos anteriormente, este hecho también se infiere de la obser- 
vación geométrica de que T no tiene eigenvectores y del Teorema 7.16. 
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Puede verse fácilmente de la matriz anterior que T* es una rotación por 
0. 

Ahora, examinaremos a las matrices que representan transformaciones 
unitarias y ortogonales. 


Definiciones. Supóngase que A es una matriz de n x n que satisface a AA* = 
= A*A = 1. Llamamos a A matriz unitaria si tiene elementos complejos, 
y la llamamos matriz ortogonal si tiene elementos reales. 


Nótese que la condición AA* = I es equivalente a afirmar que los ren- 
glones A,, ... , An de A forman un conjunto ortonormal en F° para 


Ó,, = I; EN (AA?),, = AMAS a AirAjr = (A, Aj). 


Puede hacerse una observación semejante acerca de las columnas de A 
y de la condición A*A = I. 

Se infiere también de la definición anterior que si V es un espacio 
con producto interior y T es un operador lineal en V, entonces T es unitario 


[ortogonal] si y sólo si [T]g es unitaria [ortogonal] para alguna base orto- 
normal 8 de V. 


Ejemplo 27. La matriz 

cos —senQ 

sen 9 cos Y 
es claramente ortogonal. Se puede ver fácilmente que los renglones de la 
matriz forman un conjunto ortonormal en R?. 


Sabemos que para una matriz normal compleja A [autoadjunta real] 
existe una base ortonormal £ para F" formada por eigenvectores de 
A. Por lo tanto, A es similar a una matriz diagonal D. Por el Teorema 5.1, 
la matriz Q, cuyas columnas son los vectores de P, es tal que D = Q40. 
Pero como las columnas de Q son una base ortonormal para F” se infiere 
que Q es unitaria [ortogonal]. En este caso decimos que Á es unitariamente 
equivalente [ortogonalmente equivalente] a D. Se ve fácilmente (ver Ejer- 
cicio 17), que esta relación es una relación de equivalencia en Mz. (C) 
[Mx (R)]. Más generalmente, A y B son unitariamente equivalentes [or- 
togonalmente equivalentes], si y sólo si existe una matriz unitaria [ortogo- 
nal] P tal que A = P*BP. 

El párrafo anterior ya ha demostrado la mitad de cada uno de los 
dos siguientes teoremas. 


Teorema 7.21(C). Sea-A una matriz compleja de n x n. Entonces A es normal 
si y sólo si A es unitariamente equivalente a una matriz diagonal. 


Teorema 7.21(R). Sea A una matriz real de n x n. Entonces A es autoadjunta 
si y sólo si A es ortogonalmente equivalente a una matriz real diagonal. 
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DEMOSTRACIÓN. Por las observaciones anteriores, necesitamos demostrar 
únicamente que si A es unitariamente [ortogonalmente] equivalente a una 
matriz diagonal, entonces A es normal [autoadjunta]. 

Supóngase que A = P*DP, donde P es una matriz unitaria y D es una 
matriz diagonal. Entonces A4*= (P*DP) (P*DP)* = (P*DP)(P*D*P)= 
= P*DID*P = P*DD*P. 

Análogamente A*A = P*D*DP. Como D es una matriz diagonal, sin 
embargo, tenemos que DD* = D*D. Entonces AA* = A*A. 

El resto de la demostración se deja al lector. W 


[3 4. 
Ala 3)' 


entonces A = A*. Los eigenvalores de L, son A, = 5 y A: = —5. Corres- 
pondientes a cada uno de estos eigenvalores están los eigenvectores y, = 
= (-2, 1) y y. = (1, 2). Como se esperaba, y, y y. son ortogonales. 
Sean 


Ejemplo 28. Sea 


1 1 
y = —=(=2, 1), 2 = —(1, 2 = 19 X2f- 
=D, 250,2) y eim n) 


Entonces, 8B es una base ortonormal de eigenvectores de L4. Como en el 
párrafo que precede al Teorema 7.21, sean 


-2 1 

_ V5 V5 _(5 0 

S D a Fa (o ell 
v5 y5 


Un cálculo sencillo muestra que P*AP = D. 


Una aplicación (secciones cónicas) 


Como una aplicación del Teorema 7.21, consideremos la ecuación cua- 
drática 


ax? + 2bxy + cy? + dx+ey+f=0. (12) 


Para elecciones especiales de los coeficientes de la ecuación (12), obte- 
nemos las distintas secciones cónicas. Por ejemplo, sia=c=1,b=d= 
=e=0yf= —1, obtenemos la ecuación de la circunferencia x? + y? = 
= 1 con centro en el origen. Las secciones cónicas restantes, llamadas elip- 
se, parábola e hipérbola, se obtienen mediante otra selección de coeficientes. 
La ausencia del término xy permite graficar fácilmente estas cónicas me- 
diante el método de completar el cuadrado. Por ejemplo, x? + 2x + y? + 
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+ 4y + 2=0 puede reescribirse como (x + 1)? + (y + 2)? = 3, que 
es la ecuación de una circunferencia con centro en (—1, —2) en el sistema 
de coordenadas cartesiano (x, y) y con radio v 3. Si consideramos la 
transformación de coordenadas (x, y) > (x', y'), donde x=x+1l y 
y' = y + 2, entonces nuestra ecuación se simplifica a (x")? + (y)? = 3. 
Este tipo de transfórmación (llamada translación) nos permite eliminar los 
términos en x y en y. 

Ahora, nos concentraremos únicamente en la eliminación del término 
en xy. Para hacer esto consideremos la expresión 


ax? + 2bxy + cy”, (13) 


la que se denomina forma cuadrática asociada de la ecuación (12). Las 
formas cuadráticas serán estudiadas con más detalle en la Sección 7.11. 
Si hacemos 


entonces la ecuación (13) puede reescribirse como X'AX = (AX, X). 
Por ejemplo, 3x? + 4xy + 6y puede escribirse como 


3 2 
Xx! X. 
Gs) 
El hecho de que A sea autoadjunta es crucial en nuestra exposición, 
puesto que, en virtud del Teorema 7.21, podemos escoger una matriz orto- 


gonal P y una matriz diagonal D con elementos reales en la diagonal 
A y Az, tales que P'AP = D. Ahora definamos a 


X'= G) 
y 
mediante X’ = P'X o, de manera equivalente, mediante PX’ = PP'X = X. 
Entonces 


X'AX = (PX'JA(PX'’) = X"(P'AP)X' = X"DX' = A(x +4, Y. 


Así, la transformación (x, y) > (x', y') nos permite eliminar al término en 
xy en la ecuación (13) y, por lo tanto, en la ecuación (12). 

Además, como P es ortogonal, tenemos, de acuerdo con el Ejercicio 
20(c), que det(P) = +1. Si det(P) = — 1, podemos reemplazar a P por 
O = PE, donde 


Entonces Q es ortogonal, det(Q) = 1 y 


Q'AQ = E'P'APE = E'DE = E n) 
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, Por lo tanto, también podemos suponer que det(P) = 1. De acuerdo 
con el Ejercicio 20, tenemos que P (o Pt) representa geométricamente 
una rotación. 


En resumen, el término en xy de la ecuación (12) puede ser elimina- 
do mediante una rotación de los ejes x e y a los nuevos ejes x' e y dada 
por X = PX”, donde P es una matriz ortogonal y det(P) = 1. Además, 
los coeficientes de (x)? y (y!)* son los eigenvalores de 


A= ( ao ) 
b c 
Este resultado es una nueva forma de enunciar el teorema de ejes 
principales para R*. Los argumentos anteriores, por supuesto, se extienden 
fácilmente a ecuaciones cuadráticas de n variables. Por ejemplo, para el 
caso en que n= 3, mediante una selección especial de los coeficientes 
obtenemos las superficies cuádricas —el cono elíptico, el elipsoide, el 
paraboloide hiperbólico, etc. 
Como ejemplo, considérese la ecuación cuadrática 2x? — 4xy + 5y? — 
— 36 = 0, para la cual la forma cuadrática asociada es 2x? — 4xy + 5y?, 
Con la notación anterior 
E ( 2 5) 
=2 5 


de manera que los eigenvalores de A son 6 y 1 con eigenvectores asociados 


00 


Como es de esperarse (del Teorema 7.15), estos vectores son ortogonales. 
La correspondiente base ortonormal de eigenvectores es 


1 2 
—2 Ff 1 
5 
Por lo tanto, si 
l 2 


entonces P'AP = (o 1) Bajo la transformación X = PX”, o bien 


1 = 1 
x = —_Y' + —y y = —Y + —y 


v 5 v5 y5 V5’ 
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tenemos la nueva forma cuadrática 6(x')? + (y”)?. Así, la ecuación origi- 
nal 2x? — 4xy + 5y? — 36 = 0 puede escribirse en la forma 6(x')? + 
+ (y)? = 36, en la que se puede ver fácilmente que se trata de la ecua- 
ción de una elipse. (Véase Fig. 7.4.) 


figura 7.4 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
los espacios con producto interior subyacentes son dimensionalmente fi- 
nitos. 


(a) Todo operador unitario es normal. 

(b) Todo operador ortogonal es diagonalizable. 

(c) Una matriz es unitaria si y sólo si es invertible. 

(d) Si dos matrices son unitariamente equivalentes también son seme- 
jantes. 

(e) La suma de dos matrices unitarias es unitaria. 

(f) El adjunto de un operador unitario es unitario. 

(g) SiT es un operador ortogonal en V, entonces [T]g es una matriz orto- 
gonal para cualquier base ordenada 8 para V. 
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(h) Si todos los eigenvalores de un operador son 1, entonces el operador 
debe ser unitario u ortogonal. 
(i) Un operador puede preservar la norma pero no el producto interior. 


Para cada una de las matrices siguientes A, encontrar una matriz ortogonal 
o unitaria P y una matriz diagonal D tal que P*AP = D. 


(a) 4=( > (b) a=( A (c) a= 2 A 


2 1 1 0 3 -+ 3i 5 
(d) 02 2 (e) 1 1 
A=|2 0 2 A=|1 2 1 
220 1 1 2 


Demostrar que el producto de operadores unitarios [ortogonales] es unita- 
rio [ortogonal]. 


Para z €C defínase a T,: C—C mediante T¿(u) = zu. Caracterizar aque- 
llas z para las cuales T, sea normal, autoadjunto o unitario. 


¿Cuáles de los siguientes pares de matrices son unitariamente equivalentes? 
(a) /1 0 O 1 (b) /0 1 O + 
0 1) ee AA o) 1.0) Az 0 
(c) 0 0 2 0 0 
=l 0] y 0 -1 0 
0 1 0 0 0 
(d) 0 0 1 0 0 
—1 Ol y {0 i 0 
0 1 0.0 —i 


Sea V el espacio con producto interior de las funciones continuas de valor 
complejo en [O, 1] con el producto interior 


oor 00m 


G, g) = f “m0. 


Sea hEV y defínase a T: V—»V mediante T(f) = hf. Demostrar que T es 
un operador unitario si y sólo si |A(t)| = 1 para 0<1< 1. 


Demostrar que si T es un operador unitario en un espacio con producto inte- 
rior, dimensionalmente finito, entonces T tiene una “raíz cuadrada”; esto es, 
existe un operador unitario U tal que T = U’. 


Sea V un espacio con producto interior, y sea T: V— V un operador auto- 
adjunto. Si U = (T +) (T — il)“, demostrar, utilizando el Ejercicio 9 de 
la Sección 7.5, que U es unitario. 
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9. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 
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Sea U un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Si “U(x) ' = 'xj| para toda x en alguna base ortonormal 
para V, ¿debe U ser unitaria? Demostrar o dar un contra ejemplo. 


Sea A una matriz compleja normal o real simétrica de n x n con elgenva- 
lores A,, ... , A, (no necesariamente distintos). Demostrar que 
n 


tr(4) = Nx; y tr(4*4) = 5l. 


iol 
Encontrar una matriz ortogonal cuyo primer renglón sea (4, 3, 3). 


Sea A una matriz real simétrica o normal compleja de n x n. Demostrar 
que 


det(4) = [[ 4,, 
¡=1 
donde los A; son los eigenvalores (no necesariamente distintos) de A. 


Supóngase que A y B son matrices diagonalizables. Demostrar, afirmativa 
O negativamente, que A es semejante a B si y sólo si A y B son unitaria- 
mente equivalentes. 


Sea U un operador unitario en un espacio con producto interior V, y sea 
W un subespacio U-invariante dimensionalmente finito de V. Demostrar que 


(a) U(W) =W. 
(b) WŁ es U-invariante. 


Contrastar a (b) con el resultado del Ejercicio 15. 


Encontrar un ejemplo de un operador unitario U en un espacio con pro- 
ducto interior y un subespacio U-invariante W tal que WŁ no sea U-inva- 
riante. 


Demostrar que una matriz que sea unitaria y triangular superior debe ser 
una matriz diagonal. 


Demostrar que “es unitariamente equivalente a” es una relación de equiva- 
lencia en Mn, (C). 


Sea W un subespacio dimensionalmente finito de un espacio con producto 
interior V. Por el Teorema 7.6, V= WS WL. Defínase a U: Vo V me- 
diante U(x, + x.) = x, ~ x., donde x, €W y x: € W+. Demostrar que U 
es un operador unitario autoadjunto. 


20.* 
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Sea V un espacio con producto interior, dimensionalmente finito. Un opera- 
dor lineal U en V, se llama isometria parcial si existe un subespacio W de 
V tal que ¿U(x):| = 'x' para toda x€W y U(x) = 0 para toda x € WŁ. 
Obsérvese que W no necesariamente tiene que ser U-invariante. Supóngase 
que U es tal operador y que (x,,... , xx) es una base ortonormal de W. 
Demostrar los incisos siguientes. 


(a) (U(x), U(y)) = (x, y) para toda x, y EW. Sugerencia: Utilizar el 
Ejercicio 20 de la Sección 7.1. 

(b) (U(x,),... , U(x;)) es una base ortonormal para R(U). 

(c) Existe una base ortonormal y para V tal que las primeras k columnas 
de [U], forman un conjunto ortonormal y las columnas restantes son 
nulas. 

(d) Sea (y, ..., yj} una base ortonormal para R(U)*. Sea f= 
= (U(x), ..., U(X), Y --- >, yj}. Entonces 8 es una base orto- 
normal para V. 

(e) Defínase a T como el operador lineal en V que satisface a T(U(x;)) = 
=x(1<i<k) y a Ty) =00 <i<j). Demostrar que T está 
bien definido y que T = U*. Sugerencia: Demostrar que (U(x), y) = 
= (x, T(y)) para toda x, y € f. Existen cuatro casos. 

(f) Demostrar que U* es una isometría parcial. 


Este ejercicio continúa en el Ejercicio 9 de la Sección 7.9. 


Una aplicación geométrica 


La finalidad del ejercicio siguiente es emplear el conocimiento hasta ahora 
obtenido en este capítulo para caracterizar los llamados “movimientos rígi- 
dos” en R?. Se puede pensar de una manera intuitiva en tal movimiento 
como una transformación que no afecta la forma de la figura bajo su 
acción; de ahí el nombre de “rígido”. Por ejemplo, las reflexiones, las rota- 
ciones y las translaciones (x ->x + xo) son ejemplos de movimientos rígi- 
dos. Veremos, de hecho, que todo movimiento rígido es una composición 
de estas tres transformaciones. La situación general en R" será tratada en la 
Sección 7.8 y utilizará los resultados de este ejercicio. 


Sea V un espacio real con producto interior. Una función f: V — V se llama 
movimiento rígido si 

GO — fœ)! = Ilx — yl para toda x, y €V. 
Para tal función f, defínase a T: V— V mediante T(x) = f(x) — f(0). 
(a) Demostrar que T es lineal demostrando los cuatro incisos siguientes. 


O [TCO|| = |x|] para toda x € V. 
(ii) TD) — T(y)|] = jx — y|] para toda x, vE€V. 
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Gii) (T(x), TOD) = (x, y) para toda x, y €V. Sugerencia: Ex- 
pándanse ambos lados de (ii) utilizando las propiedades de 
los productos interiores y luego iguálense los resultados. 

Giv) ||T(x + ay) — T(x) — aT(y)|| = 0 para toda x, yEV y a€R. 


(b) Utilizar (a) para deducir que todo movimiento rígido es un operador 
ortogonal seguido de una translación. 

(c) Demostrar que det(T) = +1. 

(d) Sea V = R? y sea £ la base ordenada estándar para R?. Demostrar que 
existe un ángulo 0(0 < 9 < 27) tal que 


_(cosó —senQ y CA 
[T] = a oi] si det(T) = 1 


f cos Y sen 0 

[Mls = (a 0 —cos0 
Sugerencia: Utilizar el hecho de que las columnas de [T] forman 
un subconjunto ortonormal de R?. 

(e) Usar a (d) para deducir que todo movimiento rígido en R? es una 
rotación (con respecto al origen) seguida de una translación o una re- 
flexión (con respecto al eje x) seguida de una rotación (con respecto 
al origen) seguida de una translación. Sugerencia: Obsérvese que 


cosg9 —senóGy/1l OY _ /cosg sen 0 
e a) O —1) — \senð —cosg)' 
21. Sean yı, ..., y, vectores linealmente independientes en F” y sean X,,..., 
Xn Vectores ortogonales obtenidos a partir de y,, ... , y, mediante el proceso 


de ortogonalización de Gram-Schmidt. Sea z,,... , z, la base ortonormal 
obtenida al definir 


) si det(T) = —1. 


hæl 


(a) Resolviendo la ecuación (1) de la Sección 7.2 para y, en términos 
de zx, demostrar que 


Zk m 


k-1 
Yk = xli + E Or, Zi) Zi (1<k<m). 
j=1 


(b) Sean A y Q las matrices de n x n en las cuales las columnas k son 
Yrs y Zk, respectivamente. Defínase a R € Maxn(F) mediante 


lloc)! si j= k 
Rir = < Om Zz)  sij<k 
[0 si j >k. 


Demostrar que 4 = QR. 


22. 


23. 


7.8* 
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(c) Calcular Q y R como en el inciso (b) para la matriz de 3 x 3 cuyas 
columnas son los vectores yı, Yz y ys, respectivamente, del Ejem- 
plo 12 de la Sección 7.2. 

(d) Como Q es unitaria [ortogonal] y R es triangular superior en el in- 
ciso (b), hemos demostrado que toda matriz invertible es el producto 
de una matriz unitaria [ortogonal] y una matriz triangular superior. 
Supóngase que A € Mnxn (F) es invertible y A = QR, = Q.R», donde 
Os, Q2 EMuxa (F) son unitarias y Rı, R2¿€ Mun F) son triangulares 
superiores. Demostrar que D = R,R=* es una matriz unitaria diago- 
nal. Sugerencia: Utilizar el Ejercicio 16. 

(e) La descomposición descrita en el inciso (b) proporciona un método 
de ortogonalización para resolver un sistema lineal AX = B donde 
A es invertible: Descomponer A en QR por el proceso de Gram- 
Schmidt (o por cualquier otro), donde Q sea unitaria y R sea trian- 
gular superior. Entonces QRX = B y por lo tanto RX = Q*B. Este 
último sistema puede resolverse fácilmente, puesto que R es triangu- 
lar superior. 

En un tiempo, a causa de su gran estabilidad, este método para 
resolver grandes sistemas de ecuaciones lineales por medio de una 
computadora se consideró como un método superior al de eliminación 
de Gauss, aun cuando requiere de tres veces más trabajo. (Posterior- 
mente, sin embargo, J. H. Wilkinson demostró que si el método de eli- 
minación de Gauss se Heva a cabo adecuadamente, entonces es casi 
tan estable como el método de ortogonalización.) 

Emplear el método de ortogonalización y el inciso (c) para 
resolver el sistema 


xi + 2x, + 2x, = 1 
Xy + 2x, 11 
Xx + x=-—l. 


Encontrar nuevas coordenadas x', y' de manera que las siguientes formas 
cuadráticas puedan escribirse como A,(x')? + A2(y")?. 


(a) 1? + 4xy + y? 
(b) 2x? + 2xy + 2y? 


Considérese la expresión X'4X, donde X* = (x, y, z) y Á es como se 
definió en el Ejercicio 2(e). Encontrar un cambio de coordenadas x’, y”, z’ 
de manera que la expresión anterior pueda escribirse en la forma A,(x')* + 
+ A2(y 0)? + As (z)?. 


LA GEOMETRIA DE LOS OPERADORES ORTOGONALES 


El Ejercicio 20 de la Sección 7.7 establece que cualquier movimiento rígido 
en un espacio real con producto interior es la composición de un operador 
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ortogonal seguido de una translación. Luego, para comprender detallada- 
mente la geometría de los movimientos rígidos, es necesario analizar la 
estructura de los operadores ortogonales. Tal es la finalidad de esta sec- 
ción. Como lo descubriremos, un operador ortogonal en un espacio real 
con producto interior dimensionalmente finito es el resultado de la com- 
posición de rotaciones y reflexiones. Principiaremos nuestra investigación 
con las definiciones de estos términos. 


Definiciones. Sea T un operador lineal en un espacio real con producto interior 


dimensionalmente finito V. El operador T se llama rotación si T es la iden- 
tidad en V o si existe un subespacio bidimensional W de V, una base 
ortonormal B = ([x,, x.) para W, y un número real 9 tal que 


T(x,) = x, cos 0 + x, sen 9, T(x) = —x, sen 0 + x. cos 0, 


y T(y) = y para toda y € WŁ. Dentro de este contexto T se denomina 
rotación de W alrededor de W., El subespacio WL se llama eje de ro- 
tación. 


En la Sección 2.1 se definieron las rotaciones para el caso especial 
donde V = R. 


Definiciones. Sea T un operador lineal en un espacio real con producto interior 


dimensionalmente finito V. El operador T se llama reflexión si existe un 
subespacio unidimensional W de N tal que T(x) = —x para toda xEW 
y T(y) = y para toda y€ WŁ. Dentro de este contexto T se llama re- 
flexión de V alrededor de W-. 


Debería hacerse notar que las rotaciones y las reflexiones (o aun las 
composiciones) son operadores ortogonales. (Ver el Ejercicio 2.) La fina- 
lidad principal de esta sección es establecer que la recíproca también es 
cierta, esto es, que cualquier operador ortogonal en un espacio real con 
producto interior dimensionalmente finito es el resultado de la composi- 
ción de rotaciones y reflexiones. 


Ejemplo 29. Caracterización de operadores ortogonales en un espacio 
real unidimensional con producto interior. 


Sea T un operador ortogonal en un espacio unidimensional con produc- 
to interior V. Tómese cualquier vector x no nulo en V. Entonces V = 
= L({x}) y así T(x) = Ax para alguna A €R. Como T es ortogonal y A 
es un eigenvalor de T, à = +1. Si A = 1, entonces T es la identidad en V 
y, por lo tanto, T es una rotación. Si A = —1, entonces T(x) = —x para 
toda x €V y, por lo tanto, T es una reflexión de V alrededor de Vt = {0}. 
Luego, T es una rotación o una reflexión. Nótese que en el primer caso 
det(T) = 1 y en el segundo caso det(T) = —1. 
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Ejemplo 30. Algunas reflexiones típicas. 


(a) Sea T: R?— R: definida mediante T(a, b) = (—a, b). Si W = 
= L({e,}), entonces T(x) = —x para toda x€W y T(y) = y para toda 
y e WŁ. Luego, T es una reflexión de R? alrededor de WŁ = L({e.}), 
el eje y. 

(b) Sea T: R?— R” definida mediante T(a, b, c) = (a, b, —c). Si 
W = L([e,)), entonces T(x) = —x para toda x€W y T(y) = y para toda 
y € W! = L({e,, e:}), el plano xy. 


En el Ejemplo 29 caracterizamos a todos los operadores ortogonales 
en un espacio real unidimensional con producto interior. El teorema si- 
guiente caracteriza a todos los operadores ortogonales en un espacio real 
bidimensional con producto interior. La demostración de este resultado se 
obtiene fácilmente del Ejercicio 20 de la Sección 7.7, pues una reflexión 
alrededor del eje x seguida de una rotación por 9 es una reflexión alrede- 
dor de la recta que pasa por el origen con una pendiente de tan 49. 


Teorema 7.22. Sea T un operador ortogonal en un espacio real bidimensional 


con producto interior V. Entonces, T es o una rotación o una reflexión. 
Además, T es una rotación si y sólo si det(T) = 1 y T es una reflexión si 
y sólo si det(T) = —1. 


De acuerdo con la definición, cualquier reflexión en R” tiene los 
eigenvalores 1 y —1, y cualquier par de eigenvectores correspondientes 
a estos eigenvalores son ortogonales. Además, el eigenespacio de T corres- 
pondiente a à = I es unidimensional y, por lo tanto, puede ser descrito 


E A=!) 


figura 7.5 


como una recta que pasa por el origen. Geométricamente, T refleja a todos 
los puntos de R* alrededor de esta recta. (Véase Fig. 7.5.) Por ejemplo, si 
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es claro que L, es un operador ortogonal en R? y que det(L,) = det(A) = 
= —1. Por lo tanto, L, es una reflexión de acuerdo con el Teorema 7.22. 
Para encontrar el subespacio sobre el cual se refleja L, es suficiente en- 
contrar un eigenvector de L, correspondiente al eigenvalor A = 1. Uno de 
tales eigenvectores es 


l 
AA 
== . 
2 


ÁS 


Xx 


En consecuencia, el subespacio sobre el cual L, se refleja es la recta 


l 
75 l 
i . 
t 2 : 


TEA 


te Rọ: 


Corolario. Sea V un espacio real bidimensional con producto interior. La com- 


Lema. 


posición de una reflexión y una rotación en V es una reflexión en V. 


DEMOSTRACIÓN. Si T, es una reflexión en V y T, es una rotación en V, 
entonces, de acuerdo con el Teorema 7.22, det(T,) = 1 y det(T,) = —1. 
Sea T = T,T, la composición. Como T, y T, son ortogonales, también T 
lo es. Además, det(T) = det(T2) : det(T,) = —1. Luego, por el Teorema 
7.22, T es una reflexión. La demostración para T,T, es semejante. MW 


Estudiaremos ahora operadores ortogonales en espacios de dimensión 
superior. 


Si T es un operador lineal en un espacio real con producto interior dimen- 
sionalmente finito y no nulo V, entonces existe un subespacio T-invariante 
W de V tal que 1 < dim(W) < 2. 


DEMOSTRACIÓN. Fíjese una base ordenada 8 = {x,, X2, ... , Xn} para V, 
y sea A = [T]g. Sea pg: V— R" la transformación lineal definida mediante 
pg(x:) = e; para i = 1, 2, ... , n. Entonces g es un isomorfismo, y he- 


mos visto en la Sección 2.4 que el diagrama de la figura 7.6 es conmutativo, 
esto es que Ligg = gT. En consecuencia, es suficiente demostrar que existe 
un subespacio Z de R” L,-invariante tal que 1 < dim(Z) < 2. Si enton- 
ces definimos a W = $; (Z), se tendrá que W satisface la conclusión del 
teorema. (Véase Ejercicio 12.) 

Puede considerarse a la matriz A como una matriz de n x n sobre C 
y como tal puede ser utilizada para definir un operador lineal U en Cr 
mediante U(x) = Ax para todos los vectores columna x en C*. Como U 
es un operador en un espacio vectorial dimensionalmente finito sobre C, 
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L 
er a a Rn 


figura 7.6 


tiene un eigenvalor à €C. Sea x €C" un eigenvector correspondiente a A. 
Podemos escribir A = A, + ¡Az, donde A, y à: son reales y 


a, +ib, 
a, + ib, 
x= i , 
a, + ib, 
donde las a; y las b; son reales. Luego, haciendo a 
a; bı 
Az b, 
Xy — y X= 
An ba 


tenemos que x = x, + ixz, donde x, y x son n-dimensionales formadas 
por elementos reales. Nótese que al menos una de x, O x, es no nula ya 
que x Æ 0. Por lo tanto, 


U(x) = Ax = (As + ia) (x, + 1x2) 
= (AXi — ÀX) + i(MX2 + A2X1). (14) 
De la misma manera 
U(x) = A(x, T 1x2) = Ax, + ¡Axo. (15) 


Comparando las partes real e imaginaria de las Ecuaciones (14) y (15), 
concluimos que 


AX; = MX ÀX Y AX: 5 AX, F AXi. (16) 


Finalmente, sea Z = L(([x,, x»)) tomándolo como subespacio de R". Como 
xı Æ0 o x, Æ0, Z es no nulo. Luego, 1 < dim(Z) < 2 y por la Ecua- 
ción (16) Z es L,-invariante. Mm 
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Teorema 7.23. Sea T un operador ortogonal en un espacio real no nulo con 
producto interior dimensionalmente finito V. Entonces, existe una colec- 
ción de subespacios T-invariantes ortogonales por parejas [W,, W., ...., 
Wm} de V tales que 


(a) 1<dimW,)<2 parai=1,2,...,m. 
(b) V=W,0W,0 --- O Wa. 


DEMOSTRACIÓN. La demostración se hará por inducción sobre dim(V). 
Si dim(V) = 1, el resultado es evidente. Por tanto, supóngase que el re- 
sultado es cierto para dim(V) < n para algún entero fijo n > 1. 


Supóngase que dim(V) = n. En virtud del lema existe un subespacio 
W, de V T-invariante tal que 1 < dim(W,) < 2. Si W, = V, el resultado 
queda establecido. De lo contrario, Wt + {0}. En virtud del Ejercicio 13 
Wi es T-invariante, y la restricción de T a WŁ es ortogonal. Como 
dim(W;) < n, podemos aplicar la hipótesis de inducción a Ty, y con- 
cluir que existe una colección de subespacios T-invariantes ortogonales 


por parejas (W., Wa, ... , Wm} de Wẹ tales que 1 < dim(W;) < 2 para 
i=2, 3,..., m y W¿=W,0W,0--:*(QW,,. Por lo tanto, (W,, 
Wo, ... , Wm} es ortogonal por parejas y 


V=W, 0 W;=W,0QW,0 --- OQ W,,. i 


Aplicando el Ejemplo 29 y el Teorema 7.22 en el contexto del Teo- 
rema 7.23, podemos concluir que la restricción de T a W; es una rotación 
o bien una reflexión para cada i = 1, 2,..., m. Así pues, en cierto sen- 
tido, T está formado de rotaciones y reflexiones. Desafortunadamente, 
puede decirse muy poco sobre la descomposición de V en el Teorema 7.23 
en términos de unicidad. Por ejemplo, las W;, el número m de W; y 
el número de W; para las que Tw, es una reflexión no son únicas. Aun 
cuando no es único el número de W; para los cuales Tw, es una refle- 
xión, el que este número sea par o impar es una propiedad intrínseca de T. 
Además, siempre podemos descomponer a V de manera que Tw, sea 
una reflexión para a lo más un W;. Estos hechos se establecen en el 
resultado siguiente. 


Teorema 7.24. Sean T, V, Wi, ..., Wn como en el Teorema 7.23. 


(a) El que el número de i para las cuales Tw, es una reflexión sea 
par o impar depende de que det(T) = | o det(T) = —1. 

(b) Siempre es posible descomponer a Y como en el Teorema 7.23 
de manera que el número de i para las que Tw, es una refle- 
xión sea cero o uno, dependiendo de que det(T) = | o det(T) = 
= —1. Además, si Tw, es una reflexión, entonces din(W,) = Ll. 
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DEMOSTRACIÓN. 


(a) Sea r el número de W; en la descomposición para las cuales 
Tw: es una reflexión. Por lo tanto, de acuerdo con el Ejercicio 14, 


det(T) = det(Tywy,) - det(Tw,) nd det(Tw.) = (0, 


con lo que se demuestra el inciso (a). 

(b) Sea E= (xEV: T(x) = —x); entonces E es un subespacio T- 
invariante de V. Si W = E+, entonces W es T-invariante. Así, aplicando 
el Teorema 7.23 a Tw obtenemos una colección de subespacios T-inva- 
riantes ortogonales por parejas (W,, W,..., W} de W tales que 
l <dim(W;) < 2 para 1<i<k y W=W,0W,0-:-OQW,. Ob- 
sérvese que, para cada i = 1,2,...,k, Tw, es una rotación. De lo con- 
trario, si Tw, es una reflexión, existe un elemento x €W; no nulo, para el 
cual T(x) = —x. Pero entonces x € W; N E c E+ N E = {0}, lo cual es 
una contradicción. Si E = {0}, se obtiene el resultado. De lo contrario, 
tómese una base ortonormal 8 para E que contenga p elementos (p > 0). 
Es posible descomponer a 8 en una unión disjunta por parejas 8 = 8, U 


U 8BU ... Uf, tal que cada 8; contenga exactamente dos elementos 
para i <r y que 8, contega dos elementos cuando p sea par y un ele- 
mento si p es impar. Para cada i = 1, 2, ... , r, sea Wp = L(8:). Enton- 
ces, claramente (W,, W., ... , Wes ... , Wz,,) es ortogonal por parejas y 

V=W OWO OWO O Wa. (17) 


Además, si cualquier 8, contiene dos elementos, entonces 
—1 0 
dew.) =deTwds) = det (T 1) = 1 
Entonces Ty, , es una rotación y, por lo tanto, Tw, es una rotación para 
j< k +r. Si B, está formado por un elemento, entonces dim(W,,) = 1 
y det(Tw,..) = det([Tw..,Is,) = det(—1) = —1. Así pues, Tw,,, es una re- 
flexión, por el Teorema 7.23, y concluimos que la descomposición de la 
Ecuación (17) satisface la condición del inciso (b). MW 


Como consecuencia del teorema anterior, un operador ortogonal se 
puede descomponer como un producto de rotaciones y reflexiones. 


Corolario. Sea T un operador ortogonal en un espacio real con producto interior 
dimensionalmente finito V. Entonces existe una colección ([T,, To, ... , Tm) 
de operadores ortogonales en V tales que 


(a) Para cada i, T; es una reflexión o bien una rotación. 
(b) Para una i como máximo, T; es una reflexión. 

(c) T¡T, = T,T; para toda i y toda j. 

td). TE Tes ds 


l si T; es una rotación para cada i 
(e) det(T) = I , á 
SE l en cualquier otro caso 
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DEMOSTRACIÓN. Como en la demostración del inciso (b) del Teorema 
7.24 podemos escribir V= W,QW,O--- GQ W,, donde Tw, es una 
rotación para i < m. Para cada i = 1, 2,..., m, defínase a T;: V>V 
mediante 


TA H E) S X1 H ceo H Xp E TU) H + c+ + Xm 


donde x; €W; para toda j. Puede demostrarse fácilmente que cada T; es 
un operador ortogonal en V. De hecho, T; es una rotación o una reflexión 
dependiendo de que Tw, sea una rotación o una reflexión. Esto demuestra 
los incisos (a) y (b). Las demostraciones de (c), (d) y (e) se dejan 
como ejercicio. (Véase Ejercicio 15.) 


Ejemplo 31. Operadores ortogonales en un espacio real tridimensional 
con producto interior. 


Sea T un operador ortogonal en un espacio real tridimensional con pro- 
ducto interior V. Demostraremos que T puede descomponerse en una 
rotación y a lo más una reflexión. Sea V=W,QW,O--:-QW,, una 
descomposición como la del Teorema 7.24(b). Claramente m=2 o 
m= 3. 

Si m = 2, entonces V = W, €) W.. Sin pérdida de generalidad, supón- 
gase que dim(W,) = 1 y dim(W,) = 2. Luego, Tw, es una reflexión, o 
bien la identidad en W,, y Tw, es una rotación. Definiendo T, y Ta como 
en la demostración del corolario del Teorema 7.24, tenemos que T = T,T, 
es la composición de una rotación y a lo más una reflexión. (Nótese que 
si Tw, no es una reflexión, entonces T, es la identidad en V y T = T,.) 

Si m = 3, entonces V = W, Q W: @ W, y dim(W;) = 1 para toda i. 
Para cada i, sea T; como en la demostración del corolario del Teorema 
7.24. Si Ty, no es una reflexión, entonces T; es la identidad en W;. De lo 
contrario T; es una reflexión. Como Tw, es una reflexión para una i como 
máximo, concluimos que T es una reflexión sencilla o bien la identidad 
(una rotación). 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase para 
lo que sigue que los espacios vectoriales subyacentes son espacios reales 
con producto interior dimensionalmente finitos. 


(a) Cualquier operador ortogonal es una rotación o una reflexión. 

(b) La composición de dos rotaciones cualesquiera en un espacio bidi- 
mensional es una rotación. 

(c) La composición de dos rotaciones cualesquiera en un espacio de tres 
dimensiones es una rotación. 
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(d) La composición de dos rotaciones cualesquiera en un espacio de 
cuatro dimensiones es una rotación. 

(e) El operador identidad es una rotación. 

(f) La composición de dos reflexiones es una reflexión. 

(g) Cualquier operador ortogonal es un?. composición de rotaciones. 

(h) Para cualquier operador ortogonal T, si det(T) = —1, entonces T es 
una reflexión. 

(i) Las reflexiones siempre tienen eigenvalores. 

(j) Las rotaciones siempre tienen eigenvalores. 


Demostrar que las rotaciones, las reflexiones y las composiciones de rota- 
ciones y reflexiones son operadores ortogonales. 


Sea 


(a) Demostrar que La: R? — R? es una reflexión. 

(b) Encontrar el eje en R? alrededor del cual se refleja L,, esto es, el 
subespacio de R? en el cual L4 actúa como la identidad. 

(c) Demostrar que Lag y Lra son rotaciones. 


Para cualquier número real $, sea 
ds ( cos y sen q 
sen —cos J i 


(a) Demostrar que L, es una reflexión. 
(b) Encontrar el eje en R? alrededor del cual L, se refleja. 


Para cualquier número real ¿, definir a Tọ = La, donde 


AE ed — sen e 
sen $ cos $ 
(a) Demostrar que cualquier rotación de R? es de la forma Tọ para algu- 
na q. 
(b) Demostrar que T¿Ty = Tẹ para cualquier $, y ER. 
(c) Deducir que cualquier par de rotaciones en R? conmutan. 
Demostrar que la composición de cualquier par de rotaciones en R* es una 
rotación en R?. 


Dados los números reales 4 y y, defínanse matrices 


1 0 0 cosy —seny 0 
A= (o coso  —seng y B=Y|seny cosy 0). 
O seng cos $ 0 0 1 
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(a) Demostrar que Lı y L son rotaciones. 
(b) Demostrar que L,, es una rotación. 
(c) Encontrar el eje de rotación para Liz. 


Demostrar que ningún operador ortogonal puede ser a la vez una rotación 
y una reflexión. 


Demostrar que si V es un espacio real de dos o tres dimensiones con pro- 
ducto interior, entonces la composición de dos reflexiones en V es una 
rotación en V. 


Dar un ejemplo de un operador ortogonal que no sea ni reflexión ni ro- 
tación. 


Sea V un espacio real con producto interior dimensionalmente finito. Defí- 
nase a T: V—V mediante T(x) = —x. Demostrar que T es un producto 
de rotaciones si y sólo si dim(V) es par. 


Completar la demostración del lema del Teorema 7.23, demostrando que 
W = $z (Z) satisface las condiciones requeridas. 


Sea T un operador ortogonal [unitario] en un espacio real [complejo] di- 
mensionalmente finito con producto interior V. Si W es un subespacio 
T-invariante de V, demostrar que 


(a) Tw es un operador ortogonal [unitario] en W. 

(b) W+ es un subespacio T-invariante de V. 
Sugerencia: Utilizar el hecho de que Tw es uno-a-uno y sobreyectivo 
para llegar a la conclusión de que, para Cualquier y EW, T*(y) = 
= T? (y) EW. 

(c) Tw- es un operador ortogonal [unitario] en W. 


Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Supóngase que V es una suma directa de subespacios T-invariantes V = 


WOWO :--OW,. Demostrar que det(T) = det(Tw,) -det(Ty,)- ---- 
det(Tw,). 


Completar la demostración del corolario del Teorema 7.24, 


Sea T un operador ortogonal en un espacio real n-dimensional con produc- 
to interior V. Supóngase que T no es la identidad. Demostrar que 


(a) Si n es impar, T puede expresarse como la composición de a lo más 
una reflexión y a lo más 4(n — 1) rotaciones. 

(b) Si n es par, entonces T puede expresarse como la composición de a 
lo más łn rotaciones o como la composición de una reflexión y a lo 
más 3(n — 2) rotaciones. 


A A O o e ES a a Ss 
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Sea V un espacio real con producto interior de dimensión 2. Para cuales- 


quier x, y €V tales que x y y |lx| = |ly[| = 1, demostrar que existe una 
rotación única T en V, tal que T(x) = y. 


PROYECCIONES ORTOGONALES 
Y El TEOREMA ESPECTRAL 


En esta sección nos basaremos en gran parte en el Teorema 7.17 para des- 
arrollar una elegante representación de un operador normal T en un espacio 
complejo dimensionalmente finito con producto interior. Demostraremos 
que tal operador puede escribirse en la forma A,T, + ... + AzTz, donde 
As, --- , àx son los distintos eigenvalores de T y T,, ... , Tẹ son “proyec- 
ciones ortogonales”. Pero primero debemos desarrollar algunos resultados 
sobre estas proyecciones especiales. 

El lector recordará de la Sección 2.1 que una transformación lineal 
T: W=>V es una proyección (en su rango R(T)) si V= R(T) SH NC). 
De hecho, T es una proyección si y sólo si T = T? (véase Ejercicio 14 de 
la Sección 2.3). 


Definición. Sea V un espacio con producto interior, y sea T: V —V una pro- 


yección. Decimos que T es una proyección ortogonal si R(T)- = N(T) y 
NM = R(T). 


Nótese que, por el Ejercicio 12(c) de la Sección 7.2, si V es dimensio- 
nalmente finito, sólo tenemos que suponer que una de las condiciones 
anteriores se cumple. Por ejemplo, si R(T)+ = N(T), entonces R(T) = 
R(T)++ = N(T}Ł. 


Ahora supongamos que W es un subespacio dimensionalmente finito 
de un espacio con producto interior V. El Teorema 7.6 garantiza que existe 
una proyección ortogonal en W. Podemos decir aún más —existe exacta- 
mente una proyección ortogonal en W. Ya que si T y U son proyecciones 
ortogonales en W, entonces R(T) = W = R(U); por lo tanto N(T) = 
R(T)}+ = R(U) = N(U), y como todas las proyecciones están deter- 
minadas de manera única por su rango y por su espacio nulo (kernel), 
tenemos que T = U. Llamamos a T la proyección ortogonal sobre W. 
Para comprender la diferencia geométrica entre una proyección arbitraria 
sobre W y la proyección ortogonal sobre W, sean V = R y W= L{(1, 
1)}. Defínanse U y T como en la Figura 7.7, donde T(v) es el pie de 
una perpendicular que parte de v e intersecta a la recta y = x, y U(a,, a.) = 
= (a, 4,). Entonces T es la proyección ortogonal sobre W, y U es una 
proyección sobre W que no es ortogonal. Nótese que v — T(v) e WŁ, 
mientras que v — Uw) ¢ WŁ. 
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figura 7.7 


De la Figura 7.7 vemos que T(v) es la “mejor aproximación en W 
para v”; esto es, si wEW, ||w — v|| > |[T(v) — v||. Esta propiedad de 
aproximación caracteriza a T. De hecho, muchos autores definen las pro- 
yecciones ortogonales en términos de esta propiedad. 


Teorema 7.25. Sea W un subespacio dimensionalmente finito de un espacio con 
producto interior V, y sea T la proyección ortogonal sobre W. Entonces, 
para cualquier vEW: el vector T(v) es el único elemento de W que se 
acerca más a V; esto es, ||v — T(w)|| < ||v — w|| para toda w EW. 


DEMOSTRACIÓN. Sea v €V. Como T es una proyección ortogonal, pode- 
mos escribir v = T(v) + (v — T(v)), donde v — T(v) EN(T) = WŁ. Sea 
w EW. En virtud del Ejercicio 10 de la Sección 7.1, tenemos que 


Iv — wl = |T) -w + v -= Tto) 
= =w Pes TO a T, 


demostrando así la desigualdad anterior. Si para alguna w €W tenemos que 
liv — w|| = |[v — T(v) ||, vemos del cálculo anterior que ||T(v) — w||? = 
= 0; esto es, w = T(v). E 


En la Sección 7.10 veremos una aplicación muy importante del Teore- 
ma 7.25 al tema de la aproximación por mínimos cuadrados que aparece 
frecuentemente en estadística. 

Por ahora, aplicaremos el Teorema 7.25 para obtener un resultado 
muy conocido en el Análisis de Fourier. Recuérdese el espacio con pro- 
ducto interior H de las funciones continuas en el intervalo [0, 27] intro- 
ducido en la Sección 7.1. Defínase a un polinomio trigonométrico de grado 
n como una función g €H de la forma 


ga) = I qe”, 


j=-n 


donde a, o a-„ son diferentes de cero. 
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Sea f CH. Demostraremos que la mejor aproximación de f por un poli- 
nomio trigonométrico de grado menor o igual a n es el polinomio cuyos 
coeficientes son los coeficientes de Fourier de f con respecto al conjunto 
ortonormal (e*/”: j es un entero). 

Para este resultado, sea W = L((eiis: |j| < n)) y sea T la proyección 
ortogonal sobre W. El Teorema 7.25 nos dice que 


n 
TH = E (f, “Mer 
j=-n 
es la mejor representación de f en H. (Véase también el Corolario 1 del 
Teorema 7.6.) 
Una caracterización algebraica de proyecciones ortogonales se tiene 
en el teorema siguiente. 


Teorema 7.26. Sea V un espacio con producto interior, y sea T un operador li- 


neal en V. Entonces T es una proyección ortogonal si y sólo si P? = T = T*. 


DEMOSTRACIÓN. Supóngase que T es una proyección ortogonal. Como 

= T? por el hecho de ser T una proyección, sólo necesitamos demostrar 
que T = T*, Ahora bien, V = R(MO NCT) y R(T} = N(M. Si x, y EV, 
entonces x = xı + xz e y = y, + ya, donde xı, y, ER(T) y xz, Xz ENCT) 
Por lo tanto 


(x, T(y)) = (xı + Xz, y.) = (x, ya) it (xz y1) = (X1, Y1) 
y 
(x, T*(y)) = (T(x), y) = (X, yı + ye) = (x, ya) + (x, Ya) = (X1, Yı). 


Así, (x, T(y)) = (x, T*(y)) para todo x, y EV y, por lo tanto, T = Te, 

Ahora supóngase que T = T? = T*, Entonces, por el Ejercicio 14 de 
la Sección 2.3, T es una proyección y, por lo tanto, debemos demostrar que 
R(T) =NM- y R(M*=N(M). Sean xER(T) y y ENT). Entonces x = 
= T(x) = T* (x), y así (x, y) = (1*(0, y) = (x, TOD) = (x, 0) =0. 
Por lo tanto x € N(T)}+, de donde se tiene que R(T) < N(T}. 

Sea ye N(T)}. Debemos demostrar que y € R(T), esto es, que T(y) = 
= y. Ahora bien, 


Iy — TI = o = TO), y — T)) 
(y, y — 100) — (10), y~ TO)). 


Como y — T(y) ENC(T), el primer término es cero. Pero también (T(y), 
y T0)) = Q, 0-10) = O) TO — TO) = O, 0) =0. 
Así, tenemos que y — T(y) = 0; esto es, y = T(y) ER(T). Por lo tanto 
R(T) = NM?. 

Utilizando lo anterior, tenemos que R(T)- = N(M > N(T) (en vir- 
tud del Ejercicio 12(b) de la Sección 7.2). Unicamente necesitamos de- 
mostrar que si x € R(T)+, entonces x EN(T). Para cualquier y € V, tene- 
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mos que (T(x), y) = (x, T*(y)) = (x, TGy)) = 0. Así, T(x) = 0 y por 
tanto xEN(T). E 


Sea V un espacio dimensionalmente finito con producto interior, W un 
subespacio de V y T la proyección ortogonal en W. Podemos escoger una 
base ortonormal B =([x,,..., Xa} para V tal que (x,,..., Xx} sea 
una base para W. Entonces [T]g es una matriz diagonal con unos a lo 
largo de los primeros k elementos de la diagonal y ceros en cualquier 
otra posición. De hecho, [T]g tiene la forma 


Ir O, 
O, O, ? 


donde O,, O. y O, son matrices nulas. 

Si U es una proyección cualquiera sobre W, podemos escoger una base 
y para V tal que [U], tenga la forma anterior; sin embargo, no es necesario 
que y sea ortonormal. 


Teorema 7.27. (El teorema espectral.) Supóngase que T es un operador lineal 


en un espacio con producto interior dimensionalmente finito V sobre F. 
Supóngase que T es normal si F =C y que T es autoadjunta si F = R. 
Si As, ... , àx son los distintos eigenvalores de T, sea Wi = Er, = {x €V: 
T(x) = A¡x) el eigenespacio de T correspondiente al eigenvalor x¡(1 < 
<i< k) y sea T; la proyección ortogonal sobre Wi(1 < i < k). Enton- 
ces 


(a) V=W,0D...QW. 


(b) Si Wi es la suma directa de los subespacios W;, j Æ 1, entonces 


WŁ = Wi. 
(c) T¡T, = ôT; para 1 <i, j<K. 
(d I=T, +... +T. 


(e) T= AT, O Me Ax Tio 


DEMOSTRACIÓN. 


(a) De acuerdo con el Teorema 7.17, T es diagonalizable y enton- 
ces, de acuerdo con el Teorema 5.14, V=W,0D ... OQ W.. 

(b) Si xEW; y y € W; para algunas i y j, entonces (x, y) = 0, de 
acuerdo con el Teorema 7.15. Se infiere de esto fácilmente que W; < WI. 
Ahora bien, de (a) tenemos que 

dim(W;) = 3 dim(W ) = dim(V) — dim(W,). 
Por otra parte, de acuerdo con el Corolario 2 del Teorema 7.6, tenemos 
que dim(W¿) = dim(V) — dim(W,). Por lo tanto, W; = W;, con lo que 
se demuestra el inciso (b). 
La demostración del inciso (c) se deja como ejercicio. 
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Como T; es la proyección ortogonal sobre W;, tenemos de (b) que 
N(T) = R(T)+ = WŁ = W;. Por lo tanto, para x€V tenemos que x = 
=x +... + xx, donde x; €W; y T;(x) = x;, demostrando el inciso (d). 

(e) Para x€V, escríbase x= x, + ... + xp, donde x; E€W;(1 < 
<j<k). Entonces T(x) = T(x) +... + Ta) = AX +... + 
+ ÀAkXk = AT (x) ao A Axla (x) = (A:T: Poras T ArT) (x). E 


El conjunto (A;, ... , àx} de eigenvalores de T se llama espectro de T, 
la suma | = T, + ... + T, del inciso (d) se llama resolución del operador 
identidad inducida por T, y la suma T = àT, + ... + AgT, del inciso (e) 
se denomina descomposición espectral de T. Como los distintos eigenvalo- 
res de T quedan determinados de manera única (hasta el orden) por los 
subespacios W; (y, por lo tanto, por las proyecciones ortogonales T;), la 
descomposición espectral de T es única. 

Con la notación anterior, sea 8 la unión de las bases ortonormales de 
los W; y sea m; = dim(W;). (Luego, m; es la multiplicidad de A;.) 


Entonces, [Tlg tiene la forma 2,1, O ee O 
10) Ad a O 
O O INS Am, 


esto es, [T]g¿ es una matriz diagonal en donde los elementos de la diagonal 
son los eigenvalores A; de T, y cada A, se repite mm; veces. Si T= AT, + 
+... + AsT, como en el inciso (e) del teorema espectral, entonces se 
tiene (del Ejercicio 7) que g(T) = g(A)T, + ... + g(A:)T; para cual- 
quier polinomio g. Más adelante utilizaremos este hecho. 

Enunciaremos ahora algunos corolarios interesantes del teorema espec- 
tral; muchos resultados más se encuentran en los ejercicios. Para lo que 
sigue supondremos que V es un espacio con producto interior dimensional- 
mente finito sobre F y que T es un operador lineal en V. 


Corolario 1. Si F= C, entonces T es normal si y sólo si T* = g(T) para algún 
g 


polinomio g. 
DEMOSTRACIÓN. Supóngase primero que T es normal. Sea T = AT, +... 
.. + A¡T, la descomposición espectral de T. Tomando el adjunto de ambos 
lados de la ecuación anterior tenemos T* = AT, + ... + AT, ya que cada 
uno de los T; son autoadjuntos. Empleando la fórmula de interpolación 
de Lagrange (ver p. 49), podemos escoger un polinomio g tal que g(A;) = 
= k; para 1 < į < k. Entonces 

gT) =2A)T, +... + ROT 
O a 
= 1%. 


l! 
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Recíprocamente, si T* = g(T) para algún polinomio g, entonces T 
conmuta con T*, puesto que T conmuta con todo polinomio en T. $ 


Corolario 2. Si F = C, entonces T es unitario si y sólo si T es normal y |A| = 1 


para todo eigenvalor A de T. 


DEMOSTRACIÓN. Supóngase primero que T es unitario y, por lo tanto, 
normal. Entonces si T(x) = Ax, tenemos que [A|- [|x|] = |Jax|] = [TED || 
I| = |lx[] y, por lo tanto, |A| = 1 si x0. 


Ahora supóngase que JA| = 1 para todo eigenvalor A de T, y sea 
T=AT +... + àT la descomposición espectral de T. Entonces, por 
el inciso (c) del Teorema 7.27, 


TT* = (AN H RAEE... +27) 
= [A1]?T, + re... + [Ar| Ty 
z= T, + ... + Tk 


Por lo tanto, T es unitario. MY 


Corolario 3. Si F=C y T es normal, entonces T es autoadjunto si y sólo si 


todo eigenvalor de T es real. 


DEMOSTRACIÓN. Sea T= AT, +... + AzTz la descomposición espectral 
de T. Supóngase que todo eigenvalor de T es real. Entonces T* = AT, + 
Foo PAS Ml H ae AT =7. 


La recíproca ya ha sido demostrada en el Corolario 2 del Teorema 
7.15. E 


Corolario 4. Sea T como en el teorema espectral con una descomposición es- 


pectral T= àT, + ... + AxTx. Entonces, cada T, es un polinomio en T. 


DEMOSTRACIÓN. —Selecciónese un polinomio gj(1 <j < k) tal que g;(A,)= 
== ij. Entonces, g;(T) == gii) T +... + g; (Àx) Tk E 91,1, +... + 
+ Ôk; Tk = Tje E 


EJERCICIOS 


1. 


Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
los espacios subyacentes con producto interior son dimensionalmente finitos. 


(a) Todas las proyecciones son autoadjuntas. 

(b) Las proyecciones ortogonales están determinadas de manera única 
por su rango. 

(c) Todo operador autoadjunto es una combinación lineal de proyecciones 
ortogonales. 
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(d) Si un operador posee una descomposición espectral, también la posee 
su adjunto. 

(e) Si T es una proyección en W, entonces T(x) es el vector de W más 
cercano a x. 

(f) Toda proyección ortogonal es un operador unitario. 


Sean V = R, W= L({(1, 2))) y £ la base ordenada estándar para V. 
Calcular [T]g, donde T es la proyección ortogonal sobre W. Realizar lo 
mismo para V = R? y W = L(((1, O, 1))). 


Para cada una de las matrices A del Ejercicio 2 de la Sección 7.7 


(Gi) Demostrar que L, posee una descomposición espectral. 

(ii) De una manera explícita, defínanse cada una de las proyecciones 
ortogonales en los eigenespacios de L4. 

(iii) Verifíquense los resultados utilizando el teorema espectral. 


Sea W un subespacio dimensionalmente finito de un espacio con producto 
interior V. Demostrar que si T es la proyección ortogonal sobre W, entonces 
| — T es la proyección ortogonal sobre WŁ. 


Sea V un espacio dimensionalmente finito con producto interior, y sea T: 
V > V una proyección. 


(a) Si Tes una proyección ortogonal, demostrar que ||T(x)|| < ||x|| para 
toda x €V. Dar un ejemplo de una proyección T para la cual no se 
cumpla esta desigualdad. Si se da la igualdad, ¿qué puede concluirse 
sobre T? 

(b) Si T es también normal y V es compleja, demostrar que T debe ser 
una proyección ortogonal. 


Si T y U son proyecciones ortogonales en un espacio con producto interior 
tales que TU = T, = UT, demostrar que R(T) = R(U)*. 


Sea T un operador normal en un espacio complejo con producto interior 
dimensionalmente finito V. Utilizar la descomposición espectral A,T, + ... 
. ¡+ àsū de T para demostrar los siguientes incisos. 


(a) Si g es un polinomio, entonces 


k 
g(T) = 3 2(A0)T:. 
í>1 
(b) Si T” = T, para alguna n, entonces T = To. 
(c) U: V—V conmuta con T si y sólo si U conmuta con cada T;. 
(d) Si U: V— V es normal y conmuta con T, entonces U = q T, +... 
... + pyT,, donde m, ... , 1, Son los eigenvalores (no necesariamen- 
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te distintos) de U. Sugerencia: Demostrar que los eigenespacios de 
T son invariantes bajo U. 

(e) Existe un operador normal U en V tal que U? = T. 

(f) T es invertible si 1,0 para I <i<k. 

(g) T es una proyección si y sólo si todo eigenvalor de T es 1 o 0. 

(h) T= —T* (tal T se denomina antisimétrico) si y sólo si todo A; es 
un número imaginario. 


Utilizar el Corolario 1 del teorema espectral para demostrar que si T es 
un operador normal en un espacio complejo dimensionalmente finito con 
producto interior y U conmuta con T, entonces U conmuta con T*. 


Refiriéndose al Ejercicio 19 de la Sección 7.7, demostrar los siguientes 
hechos sobre U. 


(a) U*U es una proyección ortogonal sobre W. 
(b)  UU*U = U. 


Diagonalización simultánea. Sea V un espacio complejo dimensionalmente 
finito con producto interior, y sean U, T: V — V operadores normales tales 
que TU = UT. Demostrar que existe una base ortonormal para V formada 
por vectores que son eigenvectores tanto de T como de U. Sugerencia: 
Emplear la sugerencia del Ejercicio 13 de la Sección 7.5 junto con el 
Ejercicio 8. 


Demostrar el inciso (c) del teorema espectral. 


7.10* APROXIMACION POR MINIMOS CUADRADOS 


Considérese el siguiente problema: Un investigador recolecta información 
mediante la realización de mediciones Yis Yz, -.. , Ym en los instantes f,, 
la, «+ , fm, respectivamente. Por ejemplo, puede realizar mediciones sobre 
el desempleo en distintas fechas durante un período. Supóngase que grafica 
los datos (f, yı), ... , (tm, Ym) como puntos del plano. (Véase Fig. 7.8.) 
A causa de la distribución de tales puntos, él piensa que existe una 
correlación lineal entre y y t, tal como y = ct + d. El investigador desearía 
encontrar el valor de los parámetros c y d de tal manera que la recta 
y = ct + d represente el mejor “ajuste” posible para los datos recopilados. 
Una estimación del ajuste es calcular el error E que representa la suma 
de los cuadrados de las distancias verticales de los puntos a la recta; esto 
es, 


E = 5 (yi = e d). 


iol 


Aproximación por mínimos cuadrados 463 


(ti Ct, +d) 


figura 7.8 


Así, su problema es encontrar las constantes c y d que minimicen a E. 
(Para esta razón, la recta y = ct + d se denomina la recta de los mínimos 
cuadrados.) Esto lo conduce a considerar el siguiente sistema de ecua- 
ciones: 


te+d=y, 
toe +d=y: 
tmt + d= Ym 
o bien AX = y, donde 
t4 l yı 
t | 
Pea 2 E E Y2 
, d y Ya 
tm 1 Ym 


Nótese que E = | y — AX”. 
Por supuesto, sería irreal suponer que tal sistema tiene una solución 
puesto que, en la práctica, el número de ecuaciones excede con mucho al 
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número de incógnitas. Pero desarrollaremos ahora un método general 
utilizando la teoría de las proyecciones ortogonales para encontrar un 
vector explícito xə €F" que minimice a E; esto es, dada una matriz Á 
de m x n, encontraremos a x, €F° tal que |ly — Axo|| < lly — Ax|| para 
todos los vectores x €F”. Este método no sólo nos permitirá encontrar la 
función lineal que se ajuste mejor a los datos, sino también el polinomio 
de cualquier grado fijo que se ajuste mejor a los datos. 

Requeriremos primero de algo de notación y de dos lemas sencillos. 

Para x, y € F°, denotaremos por (x, y), al producto interior ordinario 
de x y y en P. 


Lema 1. Sean A una matriz de m x n sobre F, x€EF" y y EF”. Entonces 
(AX, Y)m = (x, A*y)o. 


DEMOSTRACIÓN. Demostraremos el resultado para x y y contenidas en 
las bases ordenadas estándar, respectivamente, para F" y F™, Dejamos el 
caso general para el lector. Sean x = e; y y = e) dichos elementos. Utili- 
zando el Teorema 2.15, tenemos 


(4e,, e')m = (4, Cm = Aj y (e, Ate), == (e, CU, = (43), Ta Aji 
donde A' y (A*)' son las columnas i de A y j de A*, respectivamente. E 


lema 2. Sea A una matriz de m x n sobre F. Entonces rango(A*A) = ran- 
go(A). 


DEMOSTRACIÓN. Sólo tenemos que demostrar que, para x €F", A*Ax=0 
si y sólo si Ax = 0. Claramente Ax = 0 implica que A*Ax = 0. Por ello, 
supóngase que A*Ax= 0. Entonces 0 = (A*Ax, x), = (Ax, A**x)m = 
= (Ax, ÁX)m, de modo que 4x0. MW 


Corolario. Si A es una matriz de m x n tal que rangolA) = n (esto es, A 
tiene “rango completo”), entonces A*A es invertible. 


Ahora considérese el sistema AX = y, donde A es una matriz de 
mxnyye€r”. Defínase a W = (Ax: xE€F"), esto es, W = R(L¿). Ha- 
ciendo a T la proyección ortogonal sobre W, escójase a x,€F" tal que 
T(y) = Axo. Entonces, por el Teorema 7.25, ||T(y) — y|] < lju — y|! 
para toda u EW; esto es, ||4xo — y|| < ||4x — y|| para toda x€F". 

Para desarrollar un método práctico para encontrar tal xo, observamos 
que, como T es una proyección ortogonal, Ax.» — y = T(y) — yEW, y 
entonces (Ax, AXo — Y)m = O para toda x€F". Luego, por el Lema 1, 
tenemos que (x, A* (Axo — y))n = O para toda x €F"; esto es, AF(Ax, — 
— y) = 0. Así, únicamente tenemos que encontrar una solución para 
A*AX = A*y. Si, además, suponemos que rango(4) = n, entonces por 
el Lema 2 tenemos que xv. = (4*4)"4*y. Podemos resumir esta expo- 
sición en el teorema siguiente. 
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Teorema 7.28. Sea AEMmu(F) y y €F”. Entonces, existe X, € F" tal que 
(A*A)xo = A*y y |[Axo — y || < [Ax — y|| para toda x €F". Además, si 
rango(A) = n, entonces X, = (A*A)"A*y. 


Volviendo con nuestro investigador, supongamos que éste recopila los 
siguientes datos: (1, 2), (2, 3), (3, 5) y (4, 7). Entonces 


1 1 2 
2 1 3 
A= y= . 
31] ? 5s|' 
4 1 7 
por lo tanto 
1 1 
4 
d*A — l 2 3 ) 2 1 _ o e) 
1.1 1 1/13 1 10 4 
4 1 


y entonces 
1 4 —10 
*4)1=-= 
(AA) ml -10 20): 


2 


y = (;)- ol 4 Sl 2 3 >) 3 = (5) 
° Àa) 20\—10 301 1 1 1/5 0 
7 
Así, la recta y = 1.71 es la recta de mínimos cuadrados. El error E puede 
calcularse directamente como ||4x, — y||? = 0.3. 
El método anterior puede también ser aplicado si el investigador desea 


ajustar una parábola y = cf + dt + e a los datos. En este caso, él utili- 
zaría 


Por consiguiente 


como la matriz A. 
Finalmente, supóngase en el caso lineal que el investigador escogió 
sus instantes, fi, para satisfacer la expresión 


Entonces, las dos columnas de A serían ortogonales y A*A sería una matriz 
diagonal. (Véase el Ejercicio 1.) Esto, por supuesto, simplificaría mucho 
los cálculos. 
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Soluciones minimas 


En la exposición anterior mostramos que, si rango(A) = n, entonces existe 
un elemento x, €F” único tal que Ax, es el punto en W más cercano a y. 
Por supuesto, si rango(4) < n, existirá un número infinito de estos vec- 
tores. Es a menudo deseable encontrar un vector tal que su norma sea 
mínima. Para lo siguiente, haremos que b = Axe, esto es, b = T(y), don- 
de T es la proyección ortogonal sobre W. Entonces, el sistema AX = b 
tiene al menos una solución. Una solución s se llama solución mínima si 
Us * < "ul! para todas las otras soluciones u de AX = b. 


Teorema 7.29. Sean AECMnma(F) y DEF". Supóngase que AX = b tiene al 
menos una solución. Entonces 


(a) Existe exactamente una solución mínima s de AX=b y 
s € R(La.). 

(b) s es la única solución de AX = b ubicada en R(L,.); esto es, 
si u es una solución de (AA*)X = b, entonces s = A*u. 


DEMOSTRACIÓN. Para simplicidad en la notación, escribiremos N(4) = 
= N(L) y R(4*) = R(L,). Por el Teorema 7.6 y el Ejercicio 12 de la 
Sección 7.3, tenemos que F° = N(4)- O N(4) = R(4*) Ð N(4). Sea x 
una solución cualquiera de AX = b. Entonces, por lo anterior, x = s + y, 
donde sER(A*) y yEN(A). Nótese que b = Ax = As + Ay = As, de 
manera que s es una solución de AX = b que está en R(4*). Para de- 
mostrar (a), necesitamos únicamente demostrar que s es la única solución 
mínima. Sea v cualquier solución de AX = b. Por el Teorema 3.8, tene- 
mos que v = s + u, donde uEN(A). Como s € R(4*) = N(4)?, tenemos, 


de acuerdo con el Ejercicio 10 de la Sección 7.1, que [lv|[? = Us + ul? = 
= Us 2 + ul? > Jis![?. Luego, s es una solución mínima. Podemos ver 
igualmente del cálculo anterior que si ||v|| = |¡s!!, entonces u = 0 y v5 s. 


Por lo tanto, s es la única solución mínima de AX = b. 

Con el objeto de demostrar el inciso (b) supondremos que v es tam- 
bién una solución de AX = b que está en R(4*). Entonces v — sER(A*) 
N N(4) = {0}, y aív=s. M 


Ejemplo 32. Considérese el sistema 


x+2%y+ z= 4 
x= y+2z=-—ll 
x + 5y = 19. 


Sean 
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Para encontrar la solución mínima del sistema, debemos encontrar una 
solución de AA*X = b. Ahora bien, 
6 1 li 
AA* =| 1 6 —4] 
11 —4 26 


por lo que consideraremos el sistema 
6x+ y+llz= 4 
x+6y-— 4z=-—11 
l1x — 4y + 26z = 19, 
para el cual una solución es 
l 
u=|-—2]- 
0 


(Cualquier solución es suficiente.) Por lo tanto, 
—1 
s = A*u = 4 
—3 


es la solución mínima del sistema dado. 


EJERCICIOS 


1. Demostrar que si A es una matriz de m x n cuyas columnas son ortogona- 
les, entonces A*A es una matriz diagonal. 


2. Dados los datos (—3, 9), (—2, 6), (0, 2) y (1, 1), encontrar la parábola 
que proporcione el ajuste de mínimos cuadrados. Calcular E. 


3. Calcular la solución mínima de 
x+2y=z=1 
2x + 3y+z=2 
4x + Ty—z=4, 


4. Sea A una matriz de m x n. Demostrar que (Ax, Y)m = (x, A*y), para 
xE e y EF", completando así la demostración del Lema 1. 


1] 


Para la recta de mínimos cuadrados y = ct + d correspondiente a las m 
observaciones (t,, yı), ... , (tm, Ym), utilizar el Teorema 7.28 para derivar 
las ecuaciones normales: 
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(Es)0+ (Su) d=3 ty, 


i=1 i-1 i-1 


1-1 i=1 


(Sa) + ma=3 y. 


Estas ecuaciones también se pueden obtener haciendo cada una de las deri- 
vadas parciales del error E iguales a cero. 


7.11* FORMAS BILINEALES Y CUADRATICAS 


Existe una cierta clase de funciones de valor escalar de dos variables 
definidas en un espacio vectorial que a menudo se considera en el estudio 
de temas tan diversos como la geometría y el cálculo en varias variables. 
Esta es la clase de “formas bilineales”. Estudiaremos las propiedades bási- 
cas de esta clase dando importancia especial a las formas bilineales simé- 
tricas y consideraremos algunas de sus aplicaciones a las superficies cua- 
dráticas y al cálculo en varias variables. 

A lo largo de esta sección todas las bases serán consideradas como 
bases ordenadas. 


Definición. Sea V un espacio vectorial sobre un campo F. Una función H que 


va del conjunto V x V de pares ordenados de vectores en V a F, se llama 
forma bilineal en V si H es lineal en cada variable cuando la otra variable 
se mantiene fija, esto es, si 


(a) H(ax, + xo, y) = aH(x,, y) + H(x,, y) para toda X, Xə, 
yEV y a€F. 


(b) H(x ay, + y2) = aH(x, yı) + H(x, ya) para toda X, Y, 
y EV y a€F. 


Representaremos al conjunto de formas bilineales en V mediante R(V). 
Obsérvese que un producto interior en un espacio real V es una forma 
bilineal. 


Ejemplo 33. Defínase una función H: R? x R?— R mediante 


a, BN ne as b, 
H(G) (a) = 2a,b, + 3a,b. + 4a.b, — a,b, para e ; (2) ER. 


Podemos verificar directamente que H es una forma bilineal en R?. Será 
más ilustrativo y menos tedioso, sin embargo, observar que si 


E 2 3 fa, 7 b, 
a=(4 a vd y m 


A E AA A 
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entonces 
H(x, y) = x' Ay. 


La bilinealidad de H se infiere ahora directamente de la propiedad distri- 
butiva de la multiplicación de matrices sobre la suma de matrices. 


La forma bilineal anterior es un caso especial de la siguiente situación 
que es más general. 


Ejemplo 34. Sea V = F" el espacio vectorial de todos los vectores colum- 
na de longitud n sobre un campo F. Para cualquier matriz A de n x n 
con elementos de F, defínase a H: Vx V>=>F mediante 


H(x, y) = x'Ay para x, y € V. 


Nótese que, como x y y son matrices de n x 1 y A es una matriz de 
n x n, H(x, y) es una matriz de 1 x 1 para toda x, y €V. Identificamos 
a esta matriz con su elemento único. Como en el Ejemplo 33, la bilinea- 
lidad de H se obtiene de la propiedad distributiva de la multiplicación 
sobre la suma de matrices. Por ejemplo, si a€ F y x,, x., y € V, entonces 


H(axı + xə, y) = (ax, + xo)! Ay = (ax! + x!) Ay 
= ax'Ay + xlAy 
=aH(x,, y) + H(x», y). 
Enumeraremos ahora algunas propiedades que tienen todas las formas 


bilineales. Las demostraciones se dejan al lector. (Véase Ejercicio 2.) 


Para cualquier forma bilineal H en un espacio vectorial V sobre un 
campo F: 


1. Si para cualquier x € V las funciones La, R,: V — F se definen me- 
diante L(y) = H(x, y) y R(y) = H(y, x) para toda y €V, en- 
tonces Le y R, son lineales. 

2. H(0, x)= H(x, 0) = Q para toda xcV. 

3. Six, y, z, wEV, entonces 


H(x + y, z +w) = H(x, 2) + H(x, w) + HG, 2) + HO, w). 


4. SiJ: Vx V—>F está definida mediante J(x, y) = H(y, x), “en- 
tonces J es una forma bilineal. 


Para un espacio vectorial V, H,, H, e GB(V) y cualquier escalar a, defi- 
namos la suma H, + H, y el producto aH, mediante las ecuaciones 


(A, + A.) (x, y) = H, (x, y) + H,(x, y) 


(aA,) (x, y) = a(H,(x, y)) para toda x, y EV. 


470 Espacios con producto interior 


Es un ejercicio sencillo verificar que H, + H, y aH, son de nuevo for- 
mas bilineales. No es de sorprenderse que &(V) sea un espacio vectorial 
con respecto a estas operaciones. 


Teorema 7.30. Para cualquier espacio vectorial V, B(V) es un espacio vectorial 
con respecto a las anteriores definiciones de suma y de producto. 
DEMOSTRACIÓN. Ejercicio. 


Sea V un espacio vectorial n-dimensional con una base B = (x,, X2,..., 
Xn}. Para cualquier forma bilineal H € G(V) podemos asociar con H 
una matriz A de n x n cuyo elemento del renglón i y columna j esté defi- 
nido mediante 


Ai; = H(x;, xj) para toda i, j = 1, 2,..., N. 
Definición. La matriz anterior A será llamada la representación matricial de H 
con respecto a la base £. 


Podemos, por lo tanto, definir un mapeo yg de GB(V) en Maxa (F), don- 
de F es el campo de escalares para V, tal que para cualquier H e G(V), 
ya(H) = A, donde A es la representación matricial H con respecto a f. 


Ejemplo 35. Considérese la forma bilineal de H del Ejemplo 33. Sean 


sC} y enn, 


Entonces 
B=H((,),(,))-2+3+4-1=8 
1 l 
g (G) aa 
l 1 
ba (( (1) nara 
Ba = H| Dl )) =2-3-4-1=-=6 
—] —]1 
Así, 


B 4 
1 =(2 5) 


Si y es la base estándar para R?, el lector podrá verificar que 


mun =(4 i) 


NEAR ss A A e AS e A SS SIEVE OE 
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Teorema 7.31. Para cualquier espacio vectorial n-dimensional V sobre un 
campo F y cualquier base B para V, y, es un isomorfismo de BV) en 
Mna (F). 


DEMOSTRACIÓN. Dejaremos al lector 'a demostración de que yg es una 
transformación lineal. 


Para demostrar que yg es uno-a-uno, supóngase que He GB(V) y 
ya(H) = O, la matriz nula. Deseamos demostrar que H es trivial, esto 
es, H(x, y) = 0 para toda x, y €V. Fíjese una x; € 8 y recuérdese la fun- 
ción L,,: W—=F definida mediante La (x) = H(x;, x) para toda x€V. 
De acuerdo con la propiedad 1 dada en la p. 469, L,, es lineal; por hi- 
pótesis, La, (x;) = H(xi, x;) = 0 para toda x;€f8. Por lo tanto, L,, es 
la transformación nula de V en F. Entonces 


H(x; x) = ln(x) =0 para toda xEV y x; €B. (18) 


Fíjese luego una y €V arbitraria y recuérdese el mapeo Ry: V— F 
definido mediante Ry(x) = H(x, y) para toda x € V. De nuevo Ry es lineal. 
Pero por la Ecuación (18) Ry(x:) = H(x;, y) = 0 para cualquier x; € 6. 
Luego, Ry es trivial, y concluimos que H(x, y) = Ry(x) = 0 para toda 
x, y EV. Así, tenemos que H es trivial y yg es, por lo tanto, uno-a-uno. 

Para demostrar que yg es sobreyectivo, sea A € Ma. (F). Recuérdese 
el isomorfismo g: V — F" definido en la Sección 2.4. Para x€V toma- 
remos a g(x) EF" como un vector columna. Defínase un mapeo H: 
V xV: —F mediante 


H(x, y) = [ġg(x)tA[iġe(y)] para toda x, y € V. 


Por el Ejemplo 34, He G(V). Demostraremos que ¿g(H) = A. Si x;, 
x; CR, entonces pg(x;) = e; y ġg(x;) = e; En consecuencia, para cuales- 
quiera i y j, 

A(Xi, xi) = [pp(xi1'Alóp(x5)] = etAe; = Aiz. 


Concluimos que yg(H) = A y, por lo tanto, yg es sobreyectivo. M 


Corolario 1. Para cualquier espacio vectorial n-dimensional V, R(V) es de di- 
mensión n?. 


DEMOSTRACIÓN. Ejercicio. 


El corolario siguiente queda establecido fácilmente al repasar la de- 
mostración del Teorema 7.31. 


Corolario 2. Sea V un espacio vectorial n-dimensional sobre el campo F con 
una base P. SIH € B(V) y AE Mnn (F), entonces yg(H) = A si y sólo si 
H(x, y) = [ġe (x)]'Alġg(y)] para toda x, y EV. 


El siguiente corolario es ahora una consecuencia inmediata del Coro- 
lario 2. 
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Corolario 3. Para cualquier campo F, un entero positivo n y H e G(F”), exis- 
te una matriz única AEM,x(F), a saber A = yg(H), tal que 


H(x, y) = x'Ay para toda x, y EF", 


donde B es la base estándar para F. 


Parece existir una analogía entre las formas bilineales y los opera- 
dores lineales en el hecho de que ambos están asociados con una matriz 
cuadrada única y en que esta correspondencia depende de la selección de 
una base para el espacio vectorial. Tal como en el caso de los operadores, 
uno puede hacerse la pregunta: ¿Cómo se modifica la matriz correspon- 
diente a una forma bilineal fija cuando se cambia la base? Como ya lo 
hemos visto, cuando surgió la pregunta para el caso de los operadores 
lineales, ésta condujo al estudio de la relación de similitud en las matri- 
ces cuadradas. En el caso de las formas bilineales nos orientaremos al 

e 


estudio de otra relación en las matrices cuadradas, la relación de “con- 
gruencia”. 


Definición. Se dice que dos matrices A, BE€M,,n(F) son congruentes si existe 
una matriz invertible Q € Max (F) tal que 


Q'AQ = B. 


Se puede ver fácilmente que la congruencia es una relación de equiva- 
lencia. (Véase el Ejercicio 11.) 

El teorema siguiente relaciona la congruencia con la representación 
matricial de una forma bilineal. 


Teorema 7.32. Sea V un espacio vectorial dimensionalmente finito con bases 
B = {Xi X2.. Xn} y y = {Yn Yo -+ Yn} y sea Q la matriz de cambio 
de coordenadas que transforma las coordenadas de y en coordenadas de 
B. Entonces, para cualquier H € B(V), y,(H) = Q'yw(H)Q. En particu- 
lar, yy(H) y yg(H) son congruentes. 


DEMOSTRACIÓN. Existen fundamentalmente dos demostraciones de este 
teorema. La primera implica un cálculo directo, mientras que la otra se 
obtiene inmediatamente de una observación acuciosa. Presentaremos la 
primera demostración y dejaremos la última como ejercicio. (Véase el 
Ejercicio 12.) 


Supóngase que A = yg(H) y B = y,(H). Entonces, para cualesquiera 
i y j tales que 1 <i, j <n, 


JE NO y yi= Y Q,;¡Xr. 
k=1 r=1 
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B; = Hy,y) = H = Qux ys) 
= Y OH y) 
= $ ounze $,0.x,) 
= Y Qu Y QH o x) 
= Y Qu Y Qu4s 
= Y Qu Y AL, 
= Y Qut40), 
= Y Q1k40)1, = (Q'AQ),, 


Por lo tanto, B = Q'40. E 
El corolario siguiente es el recíproco del Teorema 7.32. 


Corolario. Sea A, BEMan(F). Si A y B son congruentes, entonces existen un 
espacio vectorial n-dimensional N sobre F, bases B y y para V, y una 
forma bilineal H en V, tales que 


ya(HD) =A y y(H)=B. 


DEMOSTRACIÓN. Supóngase que Q es una matriz invertible para la que 
B = Q*AO. Sean V = F, B= [€,, €2, ..- > en) la base estándar para PF" 
y H la preimagen de A bajo yg. Sea y = (Q”, Q%..., Q”) el conjunto 
de columnas de Q. Entonces, y es una base para F" y Q es la matriz de 
cambio de coordenadas que transforma las coordenadas de y en coorde- 
nadas de 8. Luego, por el Teorema 7.32, B = O'A0 = O'yg(H)O = 
=4, (0). EE 


Tal como el problema de diagonalización para operadores lineales, 
existe un problema de “diagonalización” semejante para formas bilinea- 
les, a saber, el problema de la determinación de aquellas formas bilineales 
para las que existen representaciones matriciales diagonales. Como vere- 

de 


mos, las formas bilineales “diagonalizables” son aquellas que son “si- 
métricas”. 


Definición. Una forma bilineal H sobre un espacio vectorial V se llama simé- 
trica, si H(x, y) = H(y, x) para toda x, y EV. 
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Como el nombre lo sugiere, las formas bilineales simétricas corres- 
ponden a matrices simétricas. 


Teorema 7.33. Sea V un espacio vectorial dimensionalmente finito. Para 
H e GB(V) las siguientes proposiciones son equivalentes: 
(a) H es simétrica. 
(b) Para cualquier base y para V, y,(H) es una matriz simétrica. 
(c) Existe una base B para V tal que yg(H) es una matriz simétrica. 


DEMOSTRACIÓN. Primero demostraremos que (a) implica a (b). Supón- 
gase que H es simétrica. Sea y = [y,, Yo, ... , Yn} una base para V, y 
sea B = y, (H). Entonces, para cualquier i y cualquier j, Bi; = H(y;, y;¡)= 
= H(y;, yı) = Bj;¡. Luego, B es una matriz simétrica, demostrando así 
a (b). 


Claramente (b) implica a (c). 

Finalmente, demostraremos que (c) implica a (a). Supóngase que, 
para alguna base B= (x,, Xz, ... , Xa}, yag(H) = A es una matriz simé- 
trica. Defínase a J: V x V=>F, donde F es el campo de los escalares 
para V, mediante J(x, y) = H(y, x) para toda x, y € V. Por la propiedad 
4 dada en la p. 469, J e &(V). Sea C= ya(J). Entonces, para cualquier 
i y cualquier j, 

Ci; = J(x;, x;) = H(x;, Xi) = Aji r Aij. 


Por lo tanto, C = A. Como yg es uno-a-uno, concluimos que J = H y, por 
lo tanto, H(y, x) = J(x, y) = H(x, y) para toda x, y€V y entonces H 
es simétrica, lo que demuestra a (a). MW 


Definición. Una forma bilineal H en un espacio vectorial dimensionalmente fi- 
nito V se llama diagonalizable si existe una base B para V tal que yg(H) 
sea una matriz diagonal. 


Corolario. Sea V un espacio vectorial dimensionalmente finito. Para cualquier 
H e G(V), si H es diagonalizable, entonces H es simétrica. 


DEMOSTRACIÓN. Supóngase que H es diagonalizable. Entonces, existe 
una base 8 para V tal que ya(H) = D es una matriz diagonal. Trivial- 
mente, D es una matriz simétrica. Luego, de acuerdo con el Teorema 7.33, 
H es simétrica. MM 


Desafortunadamente, la recíproca no es cierta, como se ilustra en el 
ejemplo siguiente. 


Ejemplo 36. Sea F = Z, (véase Apéndice C), y sea V = F?. Defínase a 
H: VWx V>=>F mediante 


al(5) D Sab 
az b, 


Lema. 
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Se ve claramente que H es simétrica. De hecho, si 8 es la base estándar 
para F?, entonces 


a= =à] o) 


es una matriz simétrica. Demostraremos que el considerar que H es 
diagonalizable conduce a una contradicción. 

Supóngase que H es diagonalizable. Entonces, existe una base y para 
F? tal que B = y,(H) es una matriz diagonal. Luego, por el Teorema 7.32, 
existe una matriz invertible Q tal que B = Q'AQ. Como Q es invertible, 
rango(B) = rango(A) = 2. Luego, B es una matriz diagonal cuyos ele- 
mentos de la diagonal son no nulos. Como el único elemento no nulo 


de Fes 1, 
_(1 0 
B=(, DN 

Supóngase 
_fa b 
o=(. a) 

Entonces 


edo E e 

(o 1)=2 0:40 = (; He 0 E 3) a Ps ba + ba) 
Pero p + p = Q para toda p €F y entonces ac + ac = 0. Así, compa- 

rando los elementos superiores izquierdos de las matrices de la ecuación 


anterior, concluimos que 1 = 0, lo que es una contradicción. En conse- 
cuencia, H no es diagonalizable. 


La forma bilineal del Ejemplo 36 es anómala. La razón de que no 
sea diagonalizable parte del hecho de que el campo escalar Z, es de 
característica dos. Si F no es de característica dos, entonces 1 + 1 es inver- 
tible. Bajo estas circunstancias representaremos a “1 + 1” como “2” y su 
inverso multiplicativo como +. 

Antes de demostrar la recíproca del corolario del Teorema 7.33 para 
campos escalares distintos a los de característica dos, debemos establecer 
el lema siguiente. 


Sea H una forma bilineal simétrica no trivial en un espacio vectorial V 
sobre un campo F de característica distinta de dos. Entonces, existe un 
elemento xEV tal que H(x, x) 40. 


DEMOSTRACIÓN. Supóngase que para algunas v, w €V, H(v, w) 40. Si 
H(v, v) 40 o H(w, w) 40, no hay nada que demostrar. De lo contra- 
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rio, supóngase que H(v, v) = H(w, w) = 0. Haciendo x = v + w, tene- 
mos que 


H(x, x) = H(v, v) + H(v, w) + H(w, v) + H(w, w) 
= 2H (v, w) +0 


puesto que 240 y H(v, w) 40. E 


Teorema 7.34. Sea V un espacio vectorial dimensionalmente finito sobre un 


campo F de característica distinta de dos. Entonces, toda forma simétrica 
bilineal en V es diagonalizable. 


DEMOSTRACIÓN. Utilizaremos inducción matemática sobre n = dim(V). 
Si n = 1, todo miembro de @(V) es diagonalizable. Supóngase que el teo- 
rema es válido para espacios vectoriales de dimensión menor que n para 
algún entero fijo n > 1. Si H es la forma bilineal trivial, entonces, por 
supuesto, H es diagonalizable. Supóngase que H es simétrica y no trivial. 
Entonces, de acuerdo con el lema, existe un elemento xEV (necesaria- 
mente no nulo) tal que H(x, x) +0. Defínase a L: V— F mediante 
L(z) = H(x, z) para toda z€V. Entonces, L es lineal y como L(x) = 
= H(x, x) 40, L es no trivial. En consecuencia, rango(L) = 1 y, por 
lo tanto, dim(N(L)) =n — 1. La restricción de H a N(L) es evidente- 
mente una forma bilineal simétrica en un espacio vectorial de dimensión 
n — 1. Luego, por la hipótesis de inducción, existe una base ES e O 
Xn-1) para N(L) tal que H(x;, xj) = 0 para i Æj (1 <i,j<n-— 1). Há- 
gase x, = x. Entonces x ÆN(L), y por lo tanto B= (Xi, ..., Xn} es una 
base para V. También H(x;, xn) = H(Xa, xi) =0 para i= 1, 2,..., 
n — 1. Concluimos que yg(H) es una matriz diagonal y entonces H es 
diagonalizable. MW 


Corolario. Sea F un campo que no tiene característica dos. Si A E Max (UF) es 


una matriz simétrica, entonces A es congruente con una matriz diagonal. 
DEMOSTRACIÓN. Ejercicio. 


Sea A una matriz simétrica de n x n con elementos de un campo que 
no tenga característica dos. Por el corolario del Teorema 7.34, A es 
congruente con una matriz diagonal. Mostraremos cómo encontrar una 
matriz diagonal D y una matriz invertible Q tales que 040 = D. El lec- 
tor debería repasar la Sección 3.1 para recordar la relación entre las 
matrices elementales y las operaciones elementales con matrices. 

Si E es una matriz elemental de n x n, entonces AE se obtiene de 
A mediante una cierta operación elemental con columnas en A. De acuer- 
do con el Ejercicio 20, E'A se obtiene a partir de A por medio de la 
misma operación realizada en los renglones en vez de en las columnas 
de A. Entonces, E*AE se obtiene a partir de A realizando una elemental 
operación en las columnas de 4, y luego realizando la misma Operación 
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en los renglones de la matriz AE. (Nótese que puede invertirse el orden 
de las operaciones.) Ahora supóngase que Q es una matriz invertible 
y que D es una matriz diagonal tal que O'AQ = D. Por el Corolario 3 
del Teorema 3.5, Q es un producto de matrices elementales, O = EE, ... 
. .. E,. Entonces, D = Q'4Q = EE. T E'AEE, ceo Ek 

Sobre la base de la ecuación anterior, concluimos que por medio de 
algunas operaciones elementales con columnas y las operaciones corres- 
pondientes con renglones, A puede ser transformada en una matriz dia- 


gonal D. Además, si E,, E», ..., E, son las matrices elementales corres- 
pondientes a las operaciones elementales con columnas (indexadas en 
el orden en que han de ser realizadas) y si Q = EE ... Ex, entonces 
Q'AQ =D. 


El enunciado anterior proporciona la clave para encontrar Dyg 
para una A dada. 


Ejemplo 37. Supóngase que 


(1.2 
a=(> a 


Empezamos utilizando operaciones elementales con columnas para insertar 
un cero en el primer renglón, segunda columna; en este caso debemos 
restar dos veces la primera columna de A de la segunda columna de A. 
La operación correspondiente con renglones implicaría restar dos veces 
el primer renglón del segundo renglón. Sea E, la matriz elemental corres- 
pondiente a la anterior operación elemental con columnas. Entonces, 


adh Hay, 
Ed (o e 
en consecuencia, 


fn o0 E 0 
AE, = (> —1) y EAE (o 00 


Obsérvese que como E, produjo un cero en el renglón 1, columna 2, E! 
produjo un cero en el renglón 2, columna 1. Luego, para 


(7 y pà} 3) oon 


Considérese ahora 


0 1 2 
A=|1 —1 3]- 
2 3 4 


Es conveniente tener +1 en la posición renglón 1, columna 1, y utilizarlo 
para eliminar a todos los demás elementos del primer renglón y de la 
primera columna de Æ. Entonces, principiemos intercambiando la pri- 
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mera y la segunda columnas de A. La matriz elemental que corresponde 
a esta operación con columnas es 


0.1.0 
E,=|1 0 0f 
0 O0 i 
Claramente 


1 
E AE, = l 
3 


Esta matriz se obtiene intercambiando las dos primeras columnas de A 
para obtener AE y luego intercambiando los dos primeros renglones de 
AE. Luego, produzcamos un cero en el primer renglón, segunda columna 
y en el segundo renglón, primera columna de E¡AE, sumando la prime- 
ra columna de E¡AE, a la segunda columna de E¡AE, y continuando 
esta operación con su correspondiente operación con renglones. Finalmen- 
te, sumemos tres veces la primera columna a la tercera columna y prosi- 
gamos con la operación correspondiente con renglones. Nótese que las 
Operaciones con columnas pueden realizarse en sucesión antes de reali- 
zar las operaciones con renglones. Entonces, si 


( l o) (o 33) 
E.=|0 1 0) y E.=f0 1 0), 
0.0 1 0 0 1 
—1 0 0 
ESEEsAE)E,E,=| 0 1 sl. 
0 5 13 


El lector puede ver ahora fácilmente que haciendo 


I 0 0 
E, =|0 1 —5pþ 
0.0 1 


tenemos 
=1 0 0 
ENESE E AE,E,E,))E, =| 0 1 01. 
0 0 -—12 


Entonces con Q = E,E,E,E, y 


Q'AQ =D. 
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El lector deberá justificar el siguiente método (semejante al introdu- 
cido en la Sección 3.2 para calcular la inversa de una matriz) para calcu- 
lar Qt (y por lo tanto Q) sin registrar por separado a cada una de las 
matrices elementales: utilizar una secuencia de operaciones elementales 
con columnas seguidas de las correspondientes operaciones elementa- 
les con renglones para modificar la matriz aumentada (A|I) en la for- 
ma (D'B), donde D es una matriz diagonal. Entonces B = Q*. 

En el ejemplo anterior este método debería producir la siguiente se- 
cuencia de matrices: 


0 1 2|100 10 21100 
aAln=| 1 -—1 0) —1 1 0) 
2 3 4loo0 1 32  4loo0 1 
1. 1 3101 0 /-10 3/0 10 
E 0 ahi o oh (o ali o o) 
3 2 4|0 01 35  4jo0 1 
—1 0 3/01 0 /-10 0/0 10 
po Slaa o} fo sha ao) 
3 5 4|0 0 1 3 5 130 0 1 
-1. 0 0/0 1 0 /—1 0 0j|010 
pe aloja oli 1 o) 
o 5 13l0 3 1 o 5 —12|0 3 1 
y 
-10 0j O 10 
o o| 1 ooo 
0 0 —-12|-5 —2 1 


Por lo tanto, 
=1 0 0 0 1 0 0O 1 —5 
D -( O 1 0], 0! = 1 1 Oj} y QO=f1 1 -—2]. 
0 0 -12 =, =2 nl 0 0 1 


Formas cuadráticas 


Asociadas con las formas bilineales simétricas existen funciones llamadas 
“formas cuadráticas”. 


Definición. Sea V un espacio vectorial sobre un campo F. Una función K: 
V> F se llama forma cuadrática si existe. una forma bilineal simétrica 

H e &(V) tal que 
K(x) = H(x, x) para toda x EV. (19) 
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Si el campo F no es de característica dos, existe una correspondencia 
uno-a-uno entre las formas bilineales simétricas y las formas cuadráticas 
dadas por la Ecuación (19). De hecho, si K es una forma cuadrática en 
un espacio vectorial V sobre un campo F cuya característica no sea dos, 
y si K(x) = A(x, x) para alguna forma bilineal simétrica en V, entonces 


A(x, y) = [K(x + y) — K(x) — K(y)]. (20) 


Véase el Ejercicio 15 para más detalles. 


Ejemplo 38. Ciertamente, el ejemplo clásico de una forma cuadrática es 
el del polinomio de segundo grado homogéneo de varias variables. Dadas 
las variables f,, t», ... , f, que toman valores en un campo F cuya carac- 
terística no sea dos y los escalares (no necesariamente distintos) a;; (1 < 
<i<j< n), defínase el polinomio 


PACET ta, 9 ta) == y ati, 
iS] 


Sea K: Frn>PF la forma cuadrática definida mediante K (Ci Cito 
Ci) = CS Cosa Cn) 


Cualquier polinomio de la forma anterior se denomina polinomio homo- 
géneo de segundo grado en n variables. De hecho, si 8 es la base estándar 
para F”, entonces la forma bilineal simétrica correspondiente a la forma 
cuadrática anterior es H, donde yg(H) = A y 


Gii si i=j 
Au = 4: =1 7 . 
i | aij si i zÆ j. 


Para ver esto, simplemente aplíquese la Ecuación (20) para obtener 
H(e;, e;) = Ai; a partir de la forma cuadrática K y verifíquese que 
f(t, ..., tn) es calculable a partir de H por medio de la Ecuación (19). 

En particular, dado el polinomio 


ft, La, tz) == 2f Fa t + Ól,t, E Atot, 


con coeficientes reales, sea 


2 3 0 
A=|3 —1 -—2]- 
o -—2 0 


Haciendo H(x, y) = x'Ay para toda x, y €R?, vemos que 


l h 
Fh, la, f) = (h, to, LA (: para (: ERÈ. 
la lz 
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Formas cuadráticas sobre el campo R 


Como las matrices simétricas sobre R son “ortogonalmente diagonaliza- 
bles” (véase el Teorema 7.21), la teoría de las formas bilineales simétricas 
y de las formas cuadráticas en espacios vectoriales dimensionalmente fini- 
tos sobre R es especialmente adecuada. El teorema siguiente y su corola- 
rio se encuentran definitivamente entre los resultados más útiles en la 
teoría de las formas bilineales y cuadráticas. 


Teorema 7.35. Sea V un espacio real dimensionalmente finito con producto 
interior, y sea H una forma bilineal simétrica en V. Entonces, existe una 
base ortonormal ß para V tal que yg(H) es una matriz diagonal. 


DEMOSTRACIÓN. Tómese cualquier base ortonormal y = [X,, Xa, ... Xn} 
para V. Sea A = yy(H). Como A es una matriz simétrica, es autoadjunta 
con respecto al producto interior en V. Aplicando el Teorema 7.21, pode- 
mos encontrar una matriz ortogonal Q tal que D = Q'AQ sea una matriz 


diagonal. Para j = 1, 2, ... , n, defínase 
yy 5 D Qix. 
i=1 
Es una operación sencilla verificar que 8 = (Ys, Yz, --- , Ynj es una base 


ortonormal para V. Además, debido a la manera en que £ está definida, 
Q es la matriz de cambio de coordenadas que transforma las coordenadas 
de 8 en coordenadas de y. Por lo tanto, de acuerdo con el Teorema 7.32, 


ye (H) = Q'y (H)Q = Q'AQ = D, 


la cual es una matriz diagonal. W 


Corolario. Sea K una forma cuadrática en un espacio real con producto interior 
dimensionalmente finito V. Existe una base ortonormal B = {Xı, X2, .-., 


Xn} para V y escalares M, dz, ... , An (NO necesariamente distintos), tales 
que si XEV y 
n 
x= S S¡X;, s;, ER, 
i=1 
entonces 
K(x) = 5 Ais? . 


1=1 
De hecho, si H es la forma bilineal simétrica determinada por K, en- 


tonces B puede escogerse para que sea cualquier base ortonormal para 
V para la cual yg(H) es una matriz diagonal. 
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DEMOSTRACIÓN. Sea H la forma bilineal simétrica para la cual K(x) = 
= H(x, x) para toda x €V. De acuerdo con el Teorema 7.35, existe una 


base ortonormal B = (x,, X2», ... , Xn} para V para la cual 
A, 0 --» 0 
0 Àz mg 0 
y ¡(H) =D = ; 
0.0 -. A 
Sea xE€ V y supóngase que 
x= 5 SiXi. 
í=1 
Entonces 
Si 
K(x) = H(x, x) = [94001 Dix) = (51, ...,s,)D| - | = b Asi E 
s 


Ejemplo 39. Para el polinomio real homogéneo de grado 2 
Ht, 12) 5 5E + 2E + 4t,t,, (21) 


encontraremos una base ortonormal 8 = (x,, x,) para R? y escalares A, 


y à: tales que si 
lı A == 1 
( ) er y ( ) = s + sora 
tə l, 


entonces f(f,, t) = Asi + Ass. Podemos pensar en s, y sz como las 
coordenadas de 

lı 

lə 


relativas a 8. Así, el polinomio f(t,, t.), como expresión que involucra 
a las coordenadas de un punto con respecto a la base estándar para R?, 
se transforma en un nuevo polinomio g(s,, $2) = AS; + AS interpretado 
como una expresión que involucra a las coordenadas relativas de un punto 
a la nueva base £. 

Sea H la forma bilineal simétrica correspondiente a la forma cuadrá- 
tica definida por la Ecuación (21). Si y es la base estándar para R?, 


entonces 
2/5 2 


Formas bilineales y cuadráticas 483 


Ahora encontraremos una matriz ortogonal Q para la cual Q'4Q sea una 
matriz diagonal. Como en la Sección 7.7, comenzaremos calculando 
una base ortonormal de vectores de L,. El polinomio característico h(t) 
de A es 


e E 
h(n) = det ( 3 a 6) (1 1). 


Por lo tanto, à= 6 y à: = 1 son los eigenvalores de A y cada uno 
de ellos tiene multiplicidad 1. Un cálculo sencillo da los eigenvectores 
correspondientes de norma uno, 


do (a) 


Como x, y x: son ortogonales, 8 = (x,, x») es una base ortonormal para 
R?. Haciendo 


vemos que Q es una matriz ortogonal y 


240-($ 1) 


Evidentemente, Q es también la matriz de cambio de coordenadas. Por 
lo tanto, 


Ya (1) '= Q'ya(H)Q = Q'AQ = (o 1) 


Entonces, de acuerdo con el corolario del Teorema 7.35, para cualquier 
X= SX + S2X2 ER?, 


K(x) = 65, + 15%. 
Y así g(s, s,) = 65% + 15. 


El ejemplo siguiente ilustra cómo puede aplicarse la teoría de las 
formas cuadráticas al problema de la descripción de las superficies cua- 
dráticas en R?. 


Ejemplo 40. Considérese la superficie $ en R? definida por la ecuación 
2t? + 6t,t, + 5t} — 2t,t, + 2t} + 3t, — 2t, — t, + 14 = 0; (22) 


es decir, $ es el conjunto de todos los elementos 


t,| e R? 
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que satisfacen la Ecuación (22). Si y es la base estándar para Rê, enton- 
ces la Ecuación (22) es una ecuación que involucra a las coordenadas 
de los puntos en $ relativos a y. Nos gustaría tomar una nueva base orto- 
normal 8 para R? tal que la ecuación que describe las coordenadas de 
cualquier punto de $ relativas a 8 sea considerablemente más sencilla 
que la Ecuación (22). 

Principiamos con la observación de que los términos de segundo grado 
en el lado izquierdo de la Ecuación (22) se suman para formar una forma 
cuadrática en R*: 

ti 
K| t, | = 2t} + 6t,t, + St? — 2t,t, + 217. 
t3 


En seguida diagonalizamos a K. Si H es la forma bilineal simétrica 
correspondiente a K y A = yy(H), entonces 


2 3 0 
A=ļ|3 5 —1]|- 
0 —1 2 


Ahora bien, el polinomio característico de A es 
2—t 3 0 
h(t) = det| 3 5—t —1 |=-—1t — 2 — De, 
0 —]1 2—t 
y, por lo tanto, A tiene los eigenvalores A, = 2, M= 7 y A¿=0. Un 
cálculo sencillo da los eigenvectores 


_ 1 : 1 Š 1 E 
Kom a 0 X: =Z —— 5 Y X; — 2 
v10X37” v35 \-1 vi4X 1 


de norma 1 correspondientes a los eigenvalores respectivos. 
Ahora, hágase a Bi= {x;, X2, x3} y 


AS: PE 
VIO 1/3 JĀ 

5 2 
2=10. 7] El 
e. S 
a/10 a735 a/14 


Como en el Ejemplo 39, Q es la matriz de cambio de coordenadas que 
transforma las coordenadas de g en coordenadas de y y 


Y ¿(1H1) = O'y (H)Q = Q'4Q = 


O O N 


0.0 
7 0j- 
0.0 
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Por el corolario del Teorema 7.35, si x = sıxı + S2X2 + S¿X3, entonces 
K(x) = 25 + 752. (23) 


Ahora estamos preparados para transformar la Ecuación (22) en una 
ecuación que contenga coordenadas relativas a £. 


Sea 
ti 
x= t, € R?. 
t3 
Si x = $5/X, TF S2X2 + S3X3, tenemos 
1 3 —3 
i - | /10 WES y 4 
1 
5 2 
ta = S1 0 + Sa WEE + S3 JĀ . 
t 
: 3 a] 1 
TO WES y/ 14 
Entonces 
t — S y 35 35, 
> VIO 435 14 
5s 2s 
t 2 3, 
a WES t- 
t, = 351 s2 TELEN 
vio A35 y 
Por lo tanto 
l4s 
31, — 2t — ty = 7 = —y ls. (24) 


Combinando las Ecuaciones (22), (23) y (24), concluimos que si x €R? 
Y X= S¡X1 t S¿X2 + S¿Xs, entonces x € $ si y sólo si 


25 +75 — Vlás, + 14=0 o bien s; =-——s, + 


(25) 


En consecuencia, si establecemos nuevos ejes x’, y” y z’ en las direcciones 
X1, X2 Y X3, respectivamente, la gráfica de la Ecuación (25) reescrita como 


v 14 12 v14 152 IIA 
(4) +09 + v14 


Ze 


coincidirá con la superficie $. Así reconocemos que § es un paraboloide 
elíptico. Véase la Figura 7.9. 
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Concluiremos esta sección con una aplicación de la teoría de formas 
cuadráticas al cálculo en varias variables —la derivación de la prueba de 
la segunda derivada para puntos extremos locales de una función de va- 
rias variables. Supondremos que el lector posee un conocimiento en el 
cálculo de funciones de varias variables hasta un nivel del teorema de 
Taylor. El lector ya está, sin duda, familiarizado con la versión de una 
variable del teorema de Taylor. Para el enunciado y la demostración de la 
versión de varias variables, consúltese, por ejemplo, Advanced Calculus 
por Avner Friedman, Holt, Rinehart y Winston, Inc., 1971. 

Sea z = f(t,, tz, ... , tn) una función de valor real de n variables para 
la cual todas las derivadas parciales de tercer orden existen y son conti- 
nuas. Se dice que la función f tiene un máximo local en el punto pER" 
si existe un número positivo ê para el cual f(p) < f(x) siempre que 
|x — p|| < 8. De la misma manera, se dice que f tiene un mínimo local 
en pER” si, para algún número 8 > 0, f(p) < f(x) siempre que |lx — 
— p|| < 3. Si f tiene un máximo o un mínimo local en p, decimos que f 
tiene un extremo local en p. Un punto p €R" se llama punto crítico de f si 
0f(p)/0t; = 0 para i = 1, 2,..., n. Es un hecho muy conocido que si f 
tiene un extremo local en un punto p €R", entonces p es un punto crítico 


figura 7.9 
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de f. Ya que, si f tiene un extremo local en p, entonces para cualquier 
i= 1, 2,..., n podemos definir una función ¿; de valor real de una 
variable mediante $;(1) = Í(P,, Po, ... >) Pi- b Pins «- + » Pa), donde pj 
es la coordenada j de p para cada j. Evidentemente, ġ; tiene un extremo 
local en 1= p;. Luego, empleando argumentos ordinarios de cálculo de 
una variable, 


dep) AP) 


dt Ot; o, 


Por lo tanto, p es un punto crítico de f. Desafortunadamente, los puntos 
críticos no son necesariamente extremos locales; pero la prueba de la 
segunda derivada nos proporciona condiciones adicionales bajo las cuales 
los puntos críticos son extremos locales. 


Teorema 7.36. (La prueba de la segunda derivada.) Sea t(t,, tə, ... , tn) una 
furción de valor real de n variables para la cual existen todas las derivadas 
parciales de tercer orden y son continuas. Sea p un punto crítico de f, y 
sea A la matriz de n x n cuyos elementos estén dados por 


PH) 
ECSEDI 


(Nótese que A es una matriz simétrica y, por lo tanto, tiene eigenvalores 
reales.) Entonces 


(a) Si todos los eigenvalores de A son positivos, entonces f tiene un 
mínimo local en p. 

(b) Si todos los eigenvalores de A son. negativos, entonces f tiene un 
máximo local en p. 

(c) Si A tiene al menos un eigenvalor positivo y uno negativo, en- 
tonces Í no tiene un extremo local en p (esto es, p es un punto 
silla de f). 

(d) Si rango(A) <n y A no tiene eigenvalores positivos ni negati- 
vos, entonces la prueba de la segunda derivada no permite obte- 
rer ninguna conclusión. 


DEMOSTRACIÓN. Si p- 0, podemos definir una función g: R" > R me- 
diante 


Blli bios) =F + Pi, EP ba T Pa) PA Dios Pa). 
Las siguientes observaciones pueden verificarse fácilmente: 


1. La función f tiene un máximo [mínimo] local en p si y sólo si g 
tiene un máximo [mínimo] local en 0 = (0, 0,..., 0). 

2. Las derivadas parciales de g en O coinciden con las correspon- 
dientes derivadas parciales de f en p. 
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3. 0 es un punto crítico de g. 
22g(0 
4. Aij = El ) 


—_—__— t i y toda j. 
(01) (01) para toda i y toda j 


En vista de lo anterior podemos suponer sin perder generalidad que p = 0 


y que f(p) =0. 
Aplicaremos en seguida el teorema de Taylor a f en O y concluiremos 


que existe una función de valor real S en R” tal que 


SO _ y Si, ...,t,) 
= lim Vt) = 0, 26 
lim Ty an E (26) 


of (0 n f(O 
Ko w =O ASO S e | 


+ S(t... tn). (27) 
Bajo las hipótesis de que O es un punto crítico y f(0) = 0, la Ecua- 


ción (27) se reduce a 


j=l È (0) 


is... É — == A tj S(h,..., tn). 28 
fl Li ete]? E) 


Definamos una forma cuadrática K: R"=>R mediante 
ti 
* n 2 
K|. 1 PFO) yy, (29) 


Sea H la forma bilineal simétrica correspondiente a K, y sea y la base 
estándar para R”. Es fácil verificar que yy(H) = 44. Como A es auto- 
adjunta, el Teorema 7.21 muestra que existe una matriz ortogonal Q 
tal que 


À 0 0 
g49=|: > 
0.0 --- 4 


es una matriz diagonal cuyos elementos de la diagonal son los eigenvalores 
de A. Sea B = ([X,, Xz, ... , Xn} la base ortonormal para R" cuyo miem- 
bro i es Q}, la columna į de Q. Entonces, O es la matriz de cambio de 
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coordenadas que transforma las coordenadas de f en coordenadas de y 
y, de acuerdo con el Teorema 7.32, 


À 

p 0 0 

o % 0 
yH) = QWE = 040 =|. . sl 

0 0 -.. h 


Supóngase que Á no es la matriz nula. Entonces, A tiene eigenvalores 
no nulos. Tómese un número positivo € tal que € < J1;|/2 para todo 
A; +0. De acuerdo con la Ecuación (26) existe un número positivo 8 
tal que si x ER" y ||x|| < 8, entonces ISO] < € |x]|?. Ahora tómese cual- 
quier x ER" para la cual ||x|| < 8. Entonces, de acuerdo con las Ecua- 
ciones (28) y (29) 


Fœ — K= 1560] < Elf 


o bien 
K(x) — Ell < fœ) < K(x) + Elix". (30) 
Si 
x= 5 SiXi, 
entonces 
N ai 1 n j 
dp =3$ y Ka) =y 2 Ai (31) 


Luego, de acuerdo con las Ecuaciones (30) y (31) 
2 fl 2 nfl 2 
S (> e)s < f(x) <3 (a+ e)s (32) 


Ahora supóngase que todos los eigenvalores de Æ son positivos. En- 
tonces, 4A; — € >0 para toda i y, por lo tanto, por la desigualdad de 
la izquierda de la Ecuación (32), 


n 1 
Ko =0<3 (¿u- e)s <10: 
Así, para ||x|; < 8, $(0) < f(x). Concluimos que f tiene un mínimo local 


en 0. De la misma manera, mediante un argumento que involucre a la 
desigualdad derecha de la Ecuación (32), concluimos que si todos los 
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eigenvalores de A son negativos, entonces f tiene un máximo local en 0. 
Esto establece los incisos (a) y (b) del teorema. 

Ahora supóngase que A tiene un eigenvalor positivo y uno negativo, 
digamos A; > 0 y A; < 0 para alguna i y alguna j. Entonces 44, — € >0 
y +A, + € <0. Sea s cualquier número real tal que |s| < 3. Entonces, 
según la Ecuación (32), 


(0) =0< (42; — E)s* < f(sxi) y fHsxj) < (Ga; + E)s? <0= f(0). 


Puesto que ||sx;]| = ||sx;|| = |s|, concluimos que f alcanza valores posi- 
tivos y negativos arbitrariamente cercanos a cero. Por lo tanto, f no tiene 
ni un máximo local ni un mínimo local en cero. Esto demuestra el inci- 
so (c). 

Para ilustrar que la prueba de la segunda derivada no permite obtener 
ninguna conclusión bajo las condiciones establecidas en el inciso (d) del 
teorema, considérense las funciones 


Ha, tt) =56-É£ y Ft, t)=ó+É 


en p = 0. En ambos casos 
_/2 0 
Aa 0) 


pero en el primer caso f no tiene un extremo local en 0, mientras que 
en el último caso f tiene un mínimo local en 0. W 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 


(a) Toda forma cuadrática es una forma bilineal. 

(b) Si dos matrices son congruentes, tienen los mismos eigenvalores. 

(c) Las formas bilineales simétricas tienen representaciones matriciales 
simétricas. 

(d) Cualquier matriz simétrica es congruente con una matriz diagonal. 

(e) La suma de dos formas bilineales simétricas es una forma bilineal 
simétrica. 

(f) Dos matrices simétricas con el mismo polinomio característico son 
representaciones matriciales de la misma forma bilineal. 

(g) Existe una forma bilineal H tal que H(x, y) +0 para toda x y 
toda y. 

(h) SiV es un espacio vectorial de dimensión n, entonces dim(B(V)) = 2n. 

(i) Sea H una forma bilineal en un espacio vectorial dimensionalmente 
finito V. Para cualquier x €V existe una y€V tal que y0 pero 
H(x, y) = 0. 

(j) Si H es una forma bilineal cualquiera en un espacio real V dimen- 
sionalmente finito, con producto interior entonces existe una base f 
para V tal que ysg(H) es una matriz diagonal. 
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2. Demostrar las propiedades 1, 2, 3 y 4 dadas en la p. 469. 


3. 


(a) 
(b) 


(c) 


Verificar que la suma de dos formas bilineales es una forma bilineal. 
Verificar que el producto de un escalar por una forma bilineal es una 
forma bilineal. 

Demostrar el Teorema 7.30. 


Determinar en cuál de los incisos siguientes se tienen formas bilineales. 


(a) 


(b) 


(c) 
(d) 


(e) 
(f) 


Sea V = C[0, 1] el espacio de las funciones continuas de valor real 
en el intervalo cerrado [0, 1]. Para f, g € V, defínase 


HG, 2) = Í DEA. 


Sea V un espacio vectorial sobre un campo F, y sea J € GB(V) no 
trivial. Defínase a H: V x V— F mediante 


H(x, y) = {U (x, y)? para toda x, y EV. 


Defínase a H: R x RR mediante H(t, t) = t + 2t. 
Considérense los miembros de R? como vectores columnas. Definir a 
H: R>R para x, yER mediante H(x, y) = det(x, y), donde 
det(x, y) representa el determinante de la matriz de 2 x 2 con x 
como su primera columna y y como su segunda columna. 

Sea V un espacio real con producto interior. Defínase a H: V x V> 
> R mediante H(x, y) = (x, y) para x, y €V. 

Sea V un espacio complejo con producto interior. Defínase a H: 
V x V>C mediante H(x, y) = (x, y) para x, y EV. 


Verificar que cada uno de los mapeos dados es una forma bilineal. Luego 


(a) 


(b) 


calcular la representación matricial de H con respecto a la base dada. 


H: R x Rè — R, donde 


a; b, 
H| | a, |, | b2 | | = a,b, — 2a1b, + ab, — a;b; 
a; b, 


con 


Ww 
il 
© 
© 
O m 


1 —1 
Sea V:= Mx (R) con la base 


e=(o 0) lo o) 0)do 1) 


Defínase a H: V Xx VR mediante H(A, B) = tr(4) :tr(B). 
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10. 


11. 


13. 
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(c) Sea 8 = [cos t, sent, cos 2t, sen 21) y V = L(B). En el espacio de 
todas las funciones continuas en R, V es un espacio tetradimensional 
con una base f. Defínase a H: Vx V=>R mediante H(f, g) = 
= f'(0) : g” (0). 


Sean V y W espacios vectoriales sobre el mismo campo, y sea T: V—W 
una transformación lineal. Para cualquier H € @(W), defínase a T(H): 
VxW-—F mediante T(H) (x,y) = H(TG0, TG) para toda x, y€V. 
Demostrar que 


(a) Para H € G(W) Î(H) e &(V). 
(b) T: &(W) — G(V) es una transformación lineal. 
(c) SiT es un isomorfismo, T también lo es. 


En la demostración del Teorema 7.31 


(a) Demostrar que para cualquier base 8, yg es lineal. 

(b) Sea V un espacio vectorial n-dimensional sobre un campo F con una 
base 8, y sea pg: VW—>F" la representación ordinaria de V con res- 
pecto a 8. Sea A € Mna (F). Defínase a H: Vx V—F mediante 
H(x, y) = [log()1'Aloóg(y)]. Demostrar que He B(V). ¿Se po- 
dría establecer esto como corolario al Ejercicio 6? 


(a) Demostrar el Corolario 1 del Teorema 7.31. 
(b) Para un espacio vectorial dimensionalmente finito V, describa un 
método para encontrar una base para R(V). 


Demostrar el Corolario 2 del Teorema 7.31. 
Demostrar el Corolario 3 del Teorema 7.31. 
Demostrar que la relación de congruencia es una relación de equivalencia. 


La siguiente descripción nos proporciona una demostración alternativa para 
el Teorema 7.32. 


(a) Si f y y son bases para un espacio vectorial dimensionalmente finito 
V, y si Q es la matriz de cambio de coordenadas, demostrar que 
pge = Lopy, donde $ y y son las representaciones ordinarias de V 
con respecto a B y y, respectivamente. 

(b) Aplicar el Corolario 2 del Teorema 7.31 al inciso (a) para obtener 
una demostración alternativa del Teorema 7.32. 


Sea V un espacio vectorial dimensionalmente finito y H € B(V). Demos- 
trar que, para bases cualesquiera £ y y de V, rango(ya(H)) = rango(yy(H)). 


14. 


15. 


16. 
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Demostrar las proposiciones siguientes. 


(a) Cualquier matriz cuadrada diagonal es simétrica. 
(b) Cualquier matriz congruente con una matriz diagonal es simétrica. 
(c) Demostrar el corolario del Teorema 7.34. 


Sea V un espacio vectorial sobre un campo F cuya característica no sea 
dos, y sea H una forma bilineal simétrica en V. Demostrar que si K(x) = 
= H(x, x) es la forma cuadrática asociada con H, entonces 


H(x, y) = +[K(x + y) — K(x) — K(y)] 
para toda x, y €V. 


Para las siguientes formas cuadráticas K sobre un espacio real con pro- 
ducto interior V, encontrar una forma bilineal simétrica H tal que K(x) = 
= H(x, x) para toda x € V. Después, encontrar una base 8 ortonormal para 
V tal que yg(H) sea una matriz diagonal. 


(a) K: R —R definida mediante 


l> 


t , 
K( ') = —2£ + 4th + É 


(b) K: R?— R definida mediante 


l> 


t ; 
x() = TË — 8LL + É 


(c) K: R?— R definida mediante 
ti 
K| t, | = 3t + 31 + 3t} — 2t,t; 
t3 


Sea $ el conjunto de todos los 


tales que 
38 + 3É£ + 3É— 2hti + 2V2(4, + 13) +1=0. 


Encontrar una base ortonormal 8 para R? tal que se simplifique la ecua- 
ción que relaciona las coordenadas de los puntos de S relativas a 8. 
Describir geométricamente a $. 


Demostrar la siguiente expresión más refinada del inciso (d) del Teore- 
ma 7.36. 
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19. 


20. 


21. 
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(a) Si 0< rango(4) <n y A tiene eigenvalores no negativos, entonces 
f no tiene un mínimo local en p. 

(b) Si O < rango(A4) <n y A tiene eigenvalores no positivos, entonces 
f no tiene un máximo local en p. 


Demostrar la siguiente variación de la prueba de la segunda derivada para 
el caso en que ni= 2. Defínase a 


p =| FrP] T_e) T 

(34)? JL Ot)? (èti) (0t2) | ` 
(a) SiD>0 yðf(p)/ O4)? > O, entonces f tiene un mínimo local en p. 
(b) SiD >O y 9f(p) / (0t,)? < 0, entonces f tiene un máximo local en p. 


(c) SiD < 0, entonces f no tiene un extremo local en p. 
(d) Si D= 0, entonces no se puede obtener conclusión alguna. 


Sugerencia: Obsérvese que D = det(A)'= àz, donde A, y Az son los 
elgenvalores de A, y A es como en el Teorema 7.36. 


Sea A una matriz de n x n sobre un campo F, y sea E una matriz ele- 
mental de n x n sobre F. En la Sección 3.1 se demostró que AE puede 
obtenerse a partir de A mediante una operación elemental con columnas. 
Demostrar que E'A puede obtenerse a partir de A mediante la misma 
operación elemental, pero realizada sobre los renglones y no sobre las 
columnas de A. Sugerencia: Nótese que E'A = (A!'E)Y*. 


Para cada una de las siguientes matrices A con elementos del campo de 
los números racionales, encontrar una matriz diagonal D y una matriz 
invertible Q tal que Q'4Q = D. 


E 


(b) a= (9 3 
1 0 


Sugerencia: Utilizar una operación elemental distinta de la de intercam- 
biar columnas. 


(c) 31 2 
A=|1 4 0 
M 
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APENDICE A CONJUNTOS 


Un conjunto es una colección de objetos, llamados elementos del conjunto. 
Si x es un elemento del conjunto A, escribimos x € A; si x no es elemento 
de A, escribimos x£A. Por ejemplo, si Z es el conjunto de los enteros, 
entonces 3€Z y 3E£Z. 

Se dice que dos conjuntos A y B son iguales, lo que se escribe- como 
A = B, si contienen exactamente los mismos elementos. Los conjuntos se 
pueden describir de dos maneras: 


1. Enlistando todos los elementos del conjunto entre llaves { }. 
2. Describiendo los elementos del conjunto en términos de alguna 
propiedad característica. 


Por ejemplo, el conjunto que consta de los elementos 1, 2, 3 y 4 se puede 
escribir como (1, 2, 3, 4) o como 


{x: x es un entero positivo menor que 5). 


Nótese que el orden en el que se enumeran los elementos es intrascendente; 
por lo tanto 
(1, 2, 3, 4) = (3,1, 2, 4) = (1, 3, 1, 4, 2). 
Ejemplo 1. Sea A el conjunto de números reales comprendidos entre 
1 y 2. Entonces, A puede escribirse como 
A= {x: xes un número real y 1 <x < 2) 
o bien, si R es el conjunto de los números reales, como 
A={xER: 1<x<2). 


Se dice que un conjunto B es subconjunto de un conjunto A, lo que 
se escribe B C A o A D B, si todo elemento de B es un elemento de A. 
Por ejemplo, {1, 2, 6} C {2, 8, 7, 6, 1}. Obsérvese que A = B si y sólo 
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si A C B y B C A, un hecho que se utiliza frecuentemente para demostrar 
que dos conjuntos son iguales. 

El conjunto vacío, denotado por Ø, es el conjunto que no contiene 
ningún elemento. El conjunto vacío es un subconjunto de todo conjunto. 

Los conjuntos pueden combinarse para formar otros conjuntos de dos 
maneras básicas. La unión de dos conjuntos A y B, que se escribe 
A U B, es el conjunto de los elementos que están en 4, o en B, o en 
ambos; esto es, 


AUB=(x: xE4Aox€B). 
La intersección de dos conjuntos A y B, que se escribe A N B, es el 
conjunto de los elementos que están en A y en B; esto es, 
ANB=(x: xEA y x€B). 


Dos conjuntos se llaman disjuntos si su intersección es el conjunto vacío. 


Ejemplo 2. Sea A = (1, 3, 5) y B= (1, 5, 7, 8). Entonces 
AUB=(1,3,5,7,8) y ANB=(1,5). 

De manera semejante, si X = (1, 2, 8) y Y = (3, 4, 5), entonces 
XUY=(1,2,3,4,5,8) y XNY= g. 


Por lo tanto, X y Y son conjuntos disjuntos. 


La unión y la intersección de más de dos conjuntos puede definirse 
de una manera análoga. Específicamente, si A,, Az, ... , A, son conjuntos, 
entonces la unión y la intersección de estos conjuntos se define como 

n 


U 4, = lx: x€ A; para alguna i = 1, 2,... n} 


i=1 


() 4.5 lx: x€A; para toda i = 1, 2,..., n}. 


f=1 


De una manera semejante, si A es un conjunto de índices y (4.: «E€A) 
es una colección de conjuntos, la unión y la intersección de estos conjun- 
tos se definen como 


U 4,= (x: x€ As para alguna a € A) 


EA 


(Y) A.= (x: x€ An para toda a€ A). 
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Ejemplo 3. Sea A = {a ER: «> 1) y sea 
4a = xER: Ásx<1+a) 
para toda «€ A, donde R es el conjunto de números reales. Entonces 
U A. =' ix € R: x> —l} y 11 4. =(x ER: 0<x<2). 


Por relación en un conjunto A queremos decir que se trata de una 
regla para determinar, para elementos arbitrarios x e y de A, si x se 
encuentra o no relacionada con y. Más precisamente, una relación en A 
es un conjunto $ de pares ordenados de elementos de A tales que 
(x, y) ES si y sólo si x tiene algún parentesco dado con y. Por ejemplo, 
en él conjunto de números reales, “es igual a”, “es menor que” y “es 
mayor que o igual a” son relaciones comunes. Una relación S en un con- 
junto A se llama relación de equivalencia en A si se cumplen las tres 
condiciones siguientes: 


1. Para toda x€4, (x, x) ES (reflexividad). 
2. Si (x, y) ES, entonces (y, x) ES (simetría). 
3. Si(x,y)€S y (y, z) ES, entonces (x, z) ES (transitividad). 


Si S es una relación de equivalencia en un conjunto A, escribiremos co- 
múnmente x — y en lugar de (x, y) €S. Por ejemplo, si definimos x — y 
para indicar que x — y es divisible entre un entero fijo n, entonces — es 
una relación de equivalentia en el conjunto de los enteros. 


APENDICE B FUNCIONES 


Si A y B son conjuntos, entonces una función f de A en B, que puede 
escribirse como f: A — B, es una regla que asocia a cada elemento de 
x en A un elemento único llamado f(x) en B. El elemento f(x) se llama 
imagen de x (bajo f) y x se llama preimagen de f(x) (bajo f). Si f: 
A > B, entonces A se llama dominio de f, y el conjunto (f(x): x€ A) 
de todas las imágenes de los elementos de A se llama rango de f. Nótese 
que el rango de f es un subconjunto de B. Si S C A, denotaremos por 
f(S) al conjunto (f(x): x€S) de todas las imágenes de los elementos 
de S$. De la misma forma, si T C B, denotaremos por f*(T) al conjunto 
(x€ A: f(x) €Tj de todas las preimágenes de los elementos de T. 
Finalmente, dos funciones f: A >B y g: A-— B son iguales si f(x) = 
= g(x) para toda x€A. 


Ejemplo 1. Supóngase que A == [— 10, 10] y B = R, el conjunto de los 
números reales. Sea f: A — B la función que asigna a cada elemento x 
en A el elemento x? 4- 1 en B; esto es, f está definida mediante f(x) = 
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= x? + 1. Entonces, A es el dominio de f y [1, 101] es el rango de f. 
Como f(2) = 5, la imagen de 2 es 5 y 2 es una preimagen de 5. Nótese 
que —2 es otra preimagen de 5. Más aún, si $ = [1, 2] y T =[82, 1011, 
entonces f(S) = [2, 5] y F(T) = [- 10, —9] U [9, 10]. 


Tal como lo muestra el ejemplo anterior, la preimagen de un elemento 
del rango no necesariamente es única. Las funciones tales que cada ele- 
mento del rango tiene una preimagen única se llama uno-a-uno; es decir, 
f: A=>B es uno-a-uno si f(x) = f(y) implica que x= y o, de un 
modo equivalente, si x 4 y implica que f(x) Æ f(y). 

Si f: A — B es una función de rango B, o sea, si f(4) = B, entonces 
f se llama sobreyectiva. 

Supóngase que f: A=>B es una función:y S C A. Entonces puede 
formarse una función fs: S-—>B, que se denomina restricción de f a S. 
definiendo fs(x) = f(x) para cada x€S. 

El ejemplo siguiente ilustra estos conceptos. 


Ejemplo 2. Sea f: [—1, 1] —>[0, 1] definida mediante f(x) = x?. Esta 
función es sobreyectiva pero no uno-a-uno ya que f(—1) =f(1) = 1. 
Nótese que si $ = [0, 1], entonces fs es sobreyectiva y uno-a-uno. Por últi- 
mo, si T = [2, 1], entonces fr es uno-a-uno, pero no sobreyectiva. 


Sean A, B y C conjuntos y f: A>B y g: B >C funciones. Apli- 
cando f seguida de g obtenemos una función gof: A — C, llamada la 
función compuesta de g y f. Entonces, (gof)(x) = g(f(x)) para toda 
x€A. Por ejemplo, sean A=B=C= R (el conjunto de los números 
reales), f(x) = sen x y g(x) = x? + 3. Entonces, (gof)(x) = g(f(x)) = 
= sen? x + 3, mientras que (fog)(x) = f(g(x)) sen = (x? + 3). Por lo 
tanto, gof 4fog. Sin embargo, la composición funcional es asociativa; 
esto es, si h: C —> D, entonces ho (gof) = (hog)of. 

Se dice que una función f: A — B es invertible si existe una función 
g: B — A tal que (fog)(y) = y para toda yEB y (gof)(x) = x para 
toda x € A. Si tal función g existe, entonces es única y se llama la inversa 
de f. Escribiremos la inversa de f (cuando exista) como f. Puede demos- 
trarse que f es invertible si y sólo si f es sobreyectiva y uno-a-uno. 


Ejemplo 3. La función f: R—>R definida mediante f(x) = 3x + 1 es 
uno-a-uno y sobreyectiva; por lo tanto, es invertible. La inversa de f es la 
función ft: R—>R definida mediante f*(x) = (x — 1)/3. 


Los siguientes hechos acerca de las funciones invertibles pueden de- 
mostrarse fácilmente: 


1. Sif: A —B es invertible, entonces f* es invertible y (f1)1 = f. 
2. Sif: A=>B yg: B—C son invertibles, entonces go f es inver- 
tible y (gof)* = ft 0g", 
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APENDICE C CAMPOS 


El conjunto de números reales es un ejemplo de una estructura algebraica 
llamada “campo”. Básicamente, un campo es un conjunto en el cual se 
pueden definir cuatro operaciones (llamadas adición, multiplicación, subs- 
tracción y división) tales que, con excepción de la división entre cero, 
la suma, el producto, la diferencia y el cociente de cualquier par de ele- 
mentos del conjunto, es un elemento del conjunto. Más detalladamente, 
un campo se define de la siguiente manera. 


Definiciones. Un campo F es un conjunto en el cual se definen dos operaciones 
+ y- (llamadas, respectivamente, adición y multiplicación) de modo que 
para cualquier par de elementos a, b en F existen: elementos únicos a + b 
y a: b en F tales que se cumplen las siguientes condiciones para todos los 
elementos a, b, c en F. 


(F1) a+b=b+a ya:b=b:a 
(conmutatividad de la adición y la multiplicación). 
(F 2) (a+b)+c=a+(b+c) y (a:b):c= a: (b:c) 
(asociatividad de la adición y la multiplicación). 
(F 3) Existen elementos distintos O y 1 en F tales que 


O+a=a y l:a=a 


(existencia de elementos identidad para la adición y la mul- 
tiplicación). 

(F 4) Para cada elemento a en F y cada elemento no nulo b en F 
existen elementos c y d en F tales que 


a+c=0 y b:d=1 


(existencia de inversos para la adición y la multiplicación). 
(F 5) a:(b+c)=a:b+a:c 
(distributividad de la multiplicación sobre la adición). 


Los elementos a + b y a'b se llaman, respectivamente, suma y producto 
de a y b. Los elementos O (léase “cero”) y 1 (léase “uno”) mencionados 
en (F 3) se llaman elementos de identidad para la adición y la multipli- 
cación, respectivamente, y los elementos c y d citados en (F 4) se deno- 
minan, respectivamente, inverso aditivo para a e inverso multiplicativo 
para b. 


Ejemplo 1. El conjunto de números reales con las definiciones ordinarias 
de adición y multiplicación es un campo que se denotará por R. 


Ejemplo 2. El conjunto de los números racionales con las definiciones 
ordinarias de adición y multiplicación es un campo. 
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Ejemplo 3. El conjunto de todos los números reales de la forma a + 


+ by 2, donde a y b son números racionales, con la adición y la multi- 
plicación como en R, es un campo. 


Ejemplo 4. El campo Z, consta de dos elementos O y 1 con las opera- 
ciones de adición y multiplicación definidas por las ecuaciones 
0+0=0, 0+1=1+0=1, 1+1=0, 
0:-0=0, 0:1=1:0=0, y 1:1=1. 


Ejemplo 5. Ni el conjunto de los enteros positivos ni el de los enteros 
con las definiciones ordinarias de adición y multiplicación es un campo, 
puesto que en ambos (F 4) no se satisface. 


Los elementos de un campo cuya existencia queda garantizada por 
(F 3) y (F 4) son únicos; esto es consecuencia del teorema siguiente. 


Teorema C.I. (Leyes de cancelación.) Sean a, b y c elementos cualesquiera de 


un campo F. 

(a) Si a+ b= c +b, entonces a = c. 

(b) Sia:b=c:byb0, entonces a = c. 
DEMOSTRACIÓN. Las demostraciones de (a) y (b) son semejantes, por 
lo que únicamente se demostrará (b). 


Si b -= 0, entonces (F 4) garantiza la existencia de un elemento d 
en F tal que b:d = 1. Multiplíquense ambos lados de la igualdad a:b = 
= c:b por d para obtener (a: b):d = (c:b)-d. Considérese el lado iz- 
quierdo de la igualdad: en virtud de (F 2) y (F 3) tenemos 

(a:b):d= a: (b-d) =a:l=a. 


De igual manera, el miembro derecho de la igualdad se reduce a c. En- 
tonces 


a=(a:b):d= (c:b)-d> c. WE 


Corolario. Los elementos O y 1 mencionados en (F 3) y los elementos c y d 


mencionados en (F 4) son únicos. 


DEMOSTRACIÓN. —Supóngase que 0' € F satisface que O + a= a para cada 
a€F. Como 0 + a=a para cada a€F, tenemos que 0 +a=0+a 
para cada a €F. Por tanto, por el Teorema C.1, 0' = 0. 


La demostración de las partes restantes es similar. Mi 
Así, cada elemento b en un campo tiene un inverso aditivo único y, 


si b4 0, también un inverso multiplicativo único. (Se demostrará en el 
corolario del Teorema C.2 que O no tiene un inverso multiplicativo.) 
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El inverso aditivo y el inverso multiplicativo de b se escriben —b y b”, 
respectivamente. Nótese que —(—b) = b y (br) = 


La substracción y la división se pueden definir en términos de la 
adición y la multiplicación utilizando los inversos aditivo y multiplicativo. 
Específicamente, la substracción de b se define como la adición de --b 
y la división entre b +0 se define como la multiplicación por b”*; esto es, 


a=b=a+(-b) y a/b=a:b". 


La división entre cero es indefinida, pero, con esta excepción, la suma, 


el producto, la diferencia y el cociente están definidos para cualquier par 
de elementos de un campo. 


Muchas de las propiedades ordinarias de la multiplicación de números 


reales son ciertas en cualquier campo, como lo demuestra el teorema si- 
guiente. 


Teorema C.2. Sean a y b elementos cualesquiera de un campo. Entonces es 
cierto cada uno de los incisos siguientes. 
(a) a:0=0 
(b) (—a):b=a: (-b) = — (ab) 
(c) (—a): (-b) =a:b 


DEMOSTRACIÓN. 
(a) Como 0 + 0 = 0, (F 5) muestra que 
a'0=a: (0+0)=a:-0+a:0. 


Luego, 0 + a:0=a:0+a-:0, y eliminando a: 0 por el Teorema C.1 
se tiene 0 = a 0. 

(b) Por definición — (a:b) es el único elemento de F tal que a: b + 
+ [~ (a: b)] = 0. Entonces, con objeto de demostrar que (—a):b= — 
— (a: b) es suficiente con mostrar que a'b + (—a):b=0. Pero —a 
es el elemento de F tal que a + (—a) = 0, y entonces 


a:b+ (—a):b = [a+ (—aJ]:b=0:b=b:0=0 


por (F 5) y el inciso (a). Así, (—a):b = — (a:b). La demostración de 
que a: (—b) = — (a:b) es similar. 
(c) Aplicando dos veces el inciso (b), tenemos que 


(—a):(—b) = —[a: (-b)] =[—(a:b)]=a:b. E 
Corolario. La identidad aditiva de un campo no tiene inverso multiplicativo. 


En un campo cualquiera F, puede suceder que una suma 1 +1 +... 
... +1 (p sumandos) sea igual a cero para algún entero positivo p. 
Por ejemplo, en el campo Z. (definido en el Ejemplo 4), 1 + 1 = 0. 
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En este caso el entero positivo más pequeño posible p para el cual una 
suma de p 1's es igual a cero, se llama característica de F; si no existe 
tal entero positivo, se dice que F tiene característica cero. Así pues, Z.» 
tiene característica dos, y R tiene característica cero. Obsérvese que si 
F es un campo de característica p 340, entonces x+x+...+x (p 
sumandos) es igual a O para toda x€F. En un campo de característica 
finita (especialmente de característica dos) surgen muchos problemas no 
usuales. Por esta razón, algunos de los resultados sobre espacios vecto- 
riales enunciados en este libro requieren que el campo sobre el que se 
defina el espacio vectorial sea de característica cero (o, al menos, de 
alguna característica diferente de dos). 

Finalmente, nótese que en otras secciones de este libro, el producto 
de dos elementos a y b de un campo se expresa ab en vez de a'b. 


APENDICE D NUMEROS COMPLEJOS 


Para los propósitos del álgebra, el campo de los números reales no es 
suficiente, puesto que existen polinomios de grado no nulo con coeficien- 
tes reales que no tienen ceros en el campo de los números reales (por 
ejemplo, x? + 1). Es pues a menudo deseable tener un campo en el 
que cualquier polinomio de grado no nulo con coeficientes de dicho campo 
tenga un cero en éste. Por esta razón “agrandaremos” el campo de los 
números reales para obtener tal campo. 


Definiciones. Un número complejo es una expresión de la forma z = a + bi, 
donde a y b son números reales llamados, respectivamente, parte real y 
parte imaginaria de zZ. 

La suma y el producto de dos números complejos z = a + bi y w = 
= c + di (donde a, b, c y d son números reales) se definen de la siguiente 
manera: 


z+ w= (a+ bi) + (c+ di) = (a +c) + (b + d)i 


zw = (a + bi)(c + di) = (ac — bd) + (bc + ad)i. 


Ejemplo 1. La suma y el producto de z = 3 — Si y w = 9 + 7i son 
Z+WwW= (3-5) + (9 + 70 = (3 +9) + [(-5) + 7]í = 12 + 2 


zw = (3 — Si)(9 + 7D = [3:9 — (-5):7]1 + [(-5):9 + 3: 7]i 
= 62 — 24i. 
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Cualquier número real c puede ser considerado como un número com- 
plejo asociando a c con el complejo c + Oi. Obsérvese que esta corres- 
pondencia conserva las sumas y los productos; es decir, 


(c + 0i) + (d + 0i) = (c +d) + 01, y (c + 01) (d + 0i) = cd + Oi. 


Cualquier número complejo de la forma bi = O + bi, donde b es un 
número real no nulo, se llama imaginario. El producto de dos números 
imaginarios es real puesto que 


(bi) (di) = (0 + bi) (0 + di) = (0 — bd) + (b-0+0-d)i 


= —bd. 
En particular, para i = 0 + 1i, tenemos que is =L 
La observación de que i} =¿:¡= —1 proporciona una manera fácil 


de recordar la definición de multiplicación de números complejos: senci- 
llamente multiplíquense dos números complejos como se multiplicarían 
dos expresiones algebraicas y sustitúyase i por —1. El Ejemplo 2 ilus- 
tra esta técnica. 


Ejemplo 2. El producto de —5 + 2i y 1 — 3i es 


(—5 + 2i) (1 — 31) = —5(1 — 3i) + 2i(1 — 3i) 
= —5 + 15i + 2i — 6P 

—5 + 15i + 2i — 6(—1) 

= 1 + 171. 


Il 


El número real 0, considerado como un número complejo, es un ele- 
mento identidad aditivo para el conjunto de números complejos, puesto 
que 

(a+ bi) +0= (a + bi) + (0 + 01) = (a +0) + (b + 0)i 
= a + bi. 
De una manera análoga, el número real 1, considerado como un número 
complejo, es un elemento identidad multiplicativo para el conjunto de los 
números complejos, pues 

(a+ bi)-1= (a+ bi)(1 + 0i) = (a: 1 — b-0) + (b:1 — a: 0) 

= a + bi. 
Es evidente que todo número complejo a + bi tiene un inverso aditivo, 
que es (—a) + (—b)i. Pero también todo número complejo, con excep- 
ción del O, tiene un inverso multiplicativo. De hecho, 


E A A A 
Si (z F 5) (z F 5) r 
En vista de los enunciados anteriores no debe sorprendernos el resul- 
tado siguiente. 
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Teorema D.1. El conjunto de números complejos con las operaciones de adi- 
ción y multiplicación definidas anteriormente es un campo. 


El campo de los números complejos será representado por C. 


Definición. El (complejo) conjugado de un número complejo a + bi es el nú- 
mero complejo a — bi. Escribiremos el conjugado del número complejo z 
como 7. 


Ejemplo 3. Los conjugados de —3 + 2i, 4 — 7i y 6 son los siguientes: 
=—3 + 2i = —3 — 2i, 4—T11=4 +71, 


6=6+0¡ = 6 - 0i = 6. 


El siguiente resultado es una consecuencia inmediata de la definición 
de complejos conjugados. 


Teorema D.2. Un número complejo z es un número real si y sólo si Zz = Z. 


Para cualquier número complejo z = a + bi, zz es real y no nega- 
tivo, ya que 
zz = (a + bi) (a — bi) = a + b. 
Este hecho puede utilizarse para definir el valor absoluto de un número 
complejo. 


Definición. El valor absoluto (o módulo) de un número complejo z = a + bi 
es el número real Y a? + b?. Escribiremos el valor absoluto de z como |z|. 
Obsérvese que zz = |zļ?. 

El hecho de que el producto de un número complejo por su conju- 
gado sea real proporciona un método sencillo para determinar el cociente 
de dos números complejos, ya que si c + di +0, entonces 


a+bi_a+bi c—di__ (ac + bd) + (bc — ad)i 


c+di c+di c—di e FË 


_ac + bd be -— ad. 

a N 
Ejemplo 4. Ilustraremos el procedimiento descrito anteriormente calcu- 
lando el cociente (1 + 4i)/(3 — 2i): 


3-2 3-21 3+2í "9+4 TĪ 


El valor absoluto de un número complejo tiene las propiedades ordi- 
narias del valor absoluto de un número real, tal como lo muestra el 
siguiente resultado. 
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Teorema D.3. Sean z y w dos números complejos cualesquiera. Entonces 


(a) [z + wi < |z| + |w]. 
(b) law] = lz] |w]. 
(c) jz! — |w] < lz + wl. 


DEMOSTRACIÓN. Sean z= a + bi ý w + c + di, donde a, b, c y d son 
números reales. 


(a) Obsérvese primero que 
O < (ad — bc)? = æd’ — 2abcd + b?e?, 


entonces 2abcd < æd? + b*c*. Sumando ac? + b?d? a ambos lados de 
la desigualdad se tendrá que 


(ac + bd)? = a?c? + 2abcd + b*d? 
< ate? + avd? + bE + bded = (a + belet d). 
Tomando las raíces cuadradas, tenemos 
ac + bd < Væ + bive + d?. 
Ahora bien, 
Iz + w|? = |(a + c) + (b + d)il? 
= (a + c)? + (b +d)? 
= a+ e +b +d + 2(ac + bd) 
Le t+tetbidetvætbvyet e 
= (Væ +b + VEFE) 
= (jz! + |w])?. 


Tomando las raíces cuadradas, obtenemos (a). 
(b) A partir de la definición de valor absoluto vemos que 


Izw| = |(a + bi) (c + di)| = | (ac — bd) + (bc + ad)il 
= y (ac — bd)? + (bc + ad)? = V ÆC + bid? + be + ad? 
= Væ + BVE +Ë = la + bil- |e + dil = |z|: |w]. 


(c) Partiendo de (a) y (b) se tiene que 
Izl = (z + w) — w| < |z + w| + ]-wl = iz + w} + |w]. 
Entonces 


(zl = [w<lz+wl. E 


Nuestra motivación para agrandar el conjunto de números reales al 
conjunto de números complejos fue la de obtener un campo tal que cada 
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polinomio de grado no nulo con coeficientes de ese campo tenga un cero. 
Nuestro siguiente resultado garantiza que el campo de números comple- 
jos tiene esta propiedad. 


Teorema D.4. (Teorema fundamental del álgebra.) Sean ao, ..., a, (n> 1) 
números complejos tales que a, +0. Entonces 


aiz LA e RIERA 
tiene un cero en el campo de los números complejos. 


Para la demostración consúltese: Principles of Mathematical Analysis, 
de Walter Rudin; McGraw-Hill Book Company, 1964. 

El siguiente importante corolario se deriva del Teorema D.4 y del 
algoritmo de la división para polinomios (Teorema E.1). 


Corolario. Si p(z) = az” + ... + az + a, es un polinomio de grado n > 1 
con coeficientes complejos, entonces existen números complejos c, . 
Cn (no necesariamente distintos) tales que 


.. 3 


p(z) = a(z — C,)...(z — C). 


Un campo se llama algebraicamente cerrado si tiene la propiedad de 
que todo polinomio con coeficientes de ese campo se descompone en un 
producto de factores de grado 1. Por lo tanto, el corolario anterior demues- 
tra que el campo de números complejos es algebraicamente cerrado. 


APENDICE E POLINOMIOS 


En este Apéndice expondremos algunas propiedades básicas de los poli- 
nomios necesarias para los Capítulos 5 y 6. Para la definición de polino- 
mios, véase la Sección 1.2. 


Definición. Un polinomio f(x) divide a un polinomio g(x) si existe un polino- 
mio q(x) tal que g(x) = f(x)q (x). 


Nuestro primer resultado enseña que el largo proceso ordinario de 
división para polinomios con coeficientes reales es válido para polinomios 
con coeficientes de un campo cualquiera. 


Teorema E.1. (Algoritmo de la división para polinomios.) Sea f,(x) un polino- 
mio de grado n, y sea f.(x) un polinomio de gredo: m > 0. Entonces, 
existen polinomios q(x) y r(x) tales que 

(a) El grado de r(x) es menor que m. 
(b) f(x) = q(x)f:(x) + r(x). 
(c) q(x) y r(x) son únicos con respecto a las condiciones (a) y 


(b). 
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DEMOSTRACIÓN. —Principiaremos estableciendo la existencia de q(x) y 
r(x) que satisfarán las condiciones (a) y (b). Si n< m, podemos to- 
mar q(x) =0 y r(x) = f,(x) que satisfacen (a) y (b). 

Supóngase, por tanto, que m < n. En este caso estableceremos la exis- 
tencia de q(x) y r(x) por inducción sobre n. Supóngase primero que 

= 0; entonces m < n implica que m = 0, de manera que f,(x) y f.(x) 

son constantes no nulas. Por lo tanto, podemos tomar a q(x) = f(x) 
(Of (x) y r(x) = 0 para satisfacer a (a) y (b). 

Ahora supongamos que el teorema es cierto siempre que f,(x) tenga 
un grado menor que n > 0. Sea 


fi(x) = anx” + aX t... ax + ao 


falx) = bmx” + bmx” > + ... + bix + bo, 


donde m < n. Defínase un polinomio h(x) mediante 


h(x) = fi(x) — a,b" "h (a) (1) 
= (a, a AO T (a, = a ba bm) X" 
Poca t a= a bb). 


Entonces A(x) es un polinomio de grado menor que n. Consideraremos 
dos casos. 


Caso 1. h(x) es de grado menor que m. En este caso, sea q(x) = 

= abx" ™ y r(x) = h(x). Entonces, de la Ecuación (1) se tiene 
f(x) = qa(x)fa(x) + r(x), 

y r(x) tiene grado menor que m. 


Caso 2. h(x) es de grado mayor o igual que m. Como h(x) tiene grado 
menor que n, podemos aplicar la hipótesis de inducción para obtener 
polinomios q,(x) y r(x) tales que r(x) es de grado menor que m y 


h(x) = q (x)f:-(x) + r(x). (2) 
Combinando las Ecuaciones (1) y (2) y resolviendo para f,(x), tenemos 


fix) = [a bp" + q ed If) + r(x). 


En este caso sea q(x) = a,bx"" + qu(x), de manera que fi(x) =q 
q(x)fa(x) + r(x), donde r(x) tiene grado menor que m. Esto demuestra 
la existencia de q(x) y r(x). sa 


Demostraremos ahora la unicidad de q y r. Supóngase que q,(x), 
q(x), r(x) y ro(x) existen de modo que r,(x) y r.(x) tienen ambos un 
grado menor que m y 


AGO) = ODIO) + r(x) = q:(x)f:(x) + r(x). 
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Entonces 


[q (x) — 200100) = r(x) — r(x). (3) 


El lado derecho de la Ecuación (3) es un polinomio de grado menor que 
m. Como f.(x) tiene grado m, debemos tener que qu(x) — q(x) es el 
polinomio cero. Por lo tanto, q(x) = q=(x), y por la Ecuación (3) 


ri(x) =r.(x). B 


Dentro del contexto del Teorema E.1, llamamos a q(x) y a r(x), 
respectivamente, cociente y residuo de la división de f.(x) entre f(x). 
Por ejemplo, el cociente y el residuo de la división del polinomio com- 


plejo 
f(x) = (3 + De — (1 — Dx + 6x? + (—6 + 20)x + Q+Dx+1 
entre el polinomio complejo 
f(x) = (3 +DL — 2ix +4 
son 


a(x) =*+ie=-2 y r(x)= (Q- 31)x +9. 


Corolario 1. Sea f(x) un polinomio cuyo grado es al menos 1, y sea a€F. 
Entonces f(a) = 0 si y sólo si x — a divide a f(x). 


DEMOSTRACIÓN. Supóngase que x — a divide a f(x). Entonces, existe 
un polinomio q(x) tal que f(x) = (x — a)q(x), por lo que f(a) = (a — 
— a)q(a) = 0: g(a) =0. 


Recíprocamente, supóngase que f(a) = O. Por el Teorema E.1 existen 
polinomios q(x) y r(x) tales que r(x) tiene grado menor que uno y 


f(x) = q(x) (x — a) + r(x). 


Sustituyendo a por x en la expresión anterior obtenemos r(a) = 0. Como 
r(x) tiene grado menor que 1, debe ser el polinomio constante r(x) = 0. 
Luego, f(x) = q(x)(x— a). W 


Para cualquier polinomio f(x) con coeficientes de un campo F, un 
elemento a€ F se llama cero de f(x) si f(a) = 0. Con esta terminología, 
el corolario anterior establece que a es un cero de f(x) si y sólo six— a 
divide a f(x). 


Corolario 2. Cualquier polinomio de grado n > 1 tiene como máximo n ceros 
distintos. 


DEMOSTRACIÓN. La demostración se hará por inducción sobre n. El re- 
sultado es evidente si 1 = 1. Supóngase entonces que el resultado es cierto 
para algún entero positivo n, y sea f(x) un polinomio de grado n + 1. 
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Si f(x) no tiene ceros, no hay nada que demostrar. Por otra parte, si a 
es un cero de f(x), por el Corolario 1 podemos escribir f(x) = (x — 
— a)q(x) para algún polinomio q(x). Nótese que q(x) debe ser de gra- 
do n; por lo tanto, por la hipótesis de inducción, q(x) puede tener a lo 
más n ceros diferentes. Entonces, como cualquier cero de f(x) diferente 


de a es también un cero de q(x), f(x) puede tener como máximo n + 1 
ceros diferentes. MW 


En el estudio de las formas canónicas surgen de manera natural poli- 
nomios que no tienen divisores comunes. 


Definición. Sean f(x) y g(x) polinomios, ambos de grado mayor que cero. 
Se dice que estos polinomios son primos relativos si no existe ningún poli- 
nomio de grado positivo que los divida a ambos. 


Por ejemplo, los polinomios f(x) = x"(x — 1) y A(x) = (x— 1) (x — 
— 2) (x — 1)(x— 2) no son primos relativos, puesto que x — 1 divide 
a f(x) y a h(x). Los polinomios f(x) y g(x) = (x — 2)(x — 3) son 
primos relativos, puesto que no tienen factores comunes de grado positivo. 

El teorema siguiente establece que una combinación de polinomios pri- 
mos relativos es igual al polinomio constante 1. 


Teorema E.2. Sif,(x) y f.(x) son polinomios primos relativos, existen polino- 
mios qı(X) y q=(x) tales que qu(x)£,(x) + q2()f.(x) = 1, que es el 
polinomio constante de grado cero con valor 1. 


DEMOSTRACIÓN. Sin pérdida de generalidad, supóngase que el grado de 
f(x) es mayor o igual que el grado de f.(x). Utilizaremos inducción 
matemática sobre el grado de f.(x). Supóngase que f.(x) tiene grado 1. 
Por el Teorema E.1 existen polinomios q(x) y r(x) tales que r(x) tiene 
grado menor que 1 y que 


fi) = 6) (x) + r(x). (4) 


Nótese que r(x) no puede ser el polinomio cero, puesto que f,(x) y 
f(x) son primos relativos. Por tanto, r(x) es una constante no nula c. 
Entonces la Ecuación (4) puede reescribirse como 


(Of (A) + (oc) 00 (a) = 1. (5) 


Así, la conclusión vale con q,(x) =c y q(x) = (—c)"q(x). Ahora 
supóngase que el teorema se cumple cuando f.(x) tenga-grado menor que 
n para algún entero n > 2 y supóngase que f.(x) tiene grado n. Por el 
Teorema E.1 existen polinomios q(x) y r(x) tales que r(x) tenga grado 
menor que n y 


f(x) = q) (a) + r(x). (6) 
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Como f,(x) y f.(x) son primos relativos, r(x) no es el polinomio cero. 
Si r(x) tiene grado cero, entonces r(x) es una constante no nula C, y 
obtenemos la Ecuación (5) como antes. Supóngase entonces que r(x) es 
de grado mayor que cero. Como r(x) tiene grado menor que n, podemos 
aplicar la hipótesis de inducción a f.(x) y a r(x), siempre que podamos 
demostrar que dichos polinomios son primos relativos. Supóngase lo con- 
trario; entonces existe un polinomio no nulo g(x) que divide a f.(x) y 
a r(x). Luego, existen polinomios h,(x) y h.(x) tales que 


r(x) =8(x)h (x) y fea) = g(x)h:(x). (7) 


Combinando las Ecuaciones (6) y (7), obtenemos 


f(x) = [qa (x)h:(x) + hi (x)]e(x), 


y entonces g(x) divide a f,(x). Pero g(x) divide a f.(x), contradiciendo 
el hecho de que f,(x) y f(x) son primos relativos, de modo que r(x) y 
f.(x) son primos relativos. Por tanto, por la hipótesis de inducción, exis- 
ten 2,(x) y g.(x) tales que 


BA) f(x) + g&(x)r(x) = 1. (8) 
Combinando las Ecuaciones (6) y (8), tenemos 
SIRO) + 2001400 — afa] 1. 
De donde 
8e(x)fi(x) + la (xa) — 2200900 1 (x) = 1. 


Haciendo q,(x) = g(x) y q2(x) = g,(x) — g»(x)q(x) obtenemos la con- 
clusión deseada. MM 


Ejemplo 1. Para los polinomios primos relativos f,(x) = x*(x — 1) y 
f(x) = (x — 2) (x — 3), se verifica fácilmente que 


ODA + efx) = 1, 
donde 
q(x) = (7x4 23) y q(x) = (2 + 5x + 6). 


A lo largo de los Capítulos 5, 6 y 7 consideramos operadores linea- 
les que son polinomios en algún operador particular T y matrices que son 
polinomios en una matriz particular A. Para estos operadores y matrices 
es conveniente la siguiente notación. 


Definiciones. Sea 


E 
f(x) = ao taxt ... + a,x” 


un polinomio con coeficientes de un campo F. Si T es un operador lineal 
en V, un espacio vectorial sobre F, definimos f(T) mediante 


f(T) = ad +aT +t... + a. 
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De manera análoga, si A es una matriz de n x n con elementos de F, 
definimos f(A) mediante 
f(A) =aI+aA+... + a A”. 
Ejemplo 2. Sea T un operador lineal en R? definido mediante T(a, b) = 
= (2a + b, a — b) y sea f(x) = x? + 2x — 3. Como T?(a, b) = (5a + b, 
a + 2b), 
f(T) (a, b) = (T? + 2T — 31) (a, b) 
= (5a + b,a + 2b) + (4a + 2b, 2a — 2b) — 3(a, b) 
= (6a + 3b, 3a — 3b). 


Análogamente, si 


entonces 


a = 4242431 = (; Jl Ao D 


_ [6 3 
3 =p 
Los siguientes tres teoremas utilizan esta notación. 


Teorema E.3. Sea f(x) un polinomio con coeficientes de un campo F, y sea T 
un operador lineal en V, donde V es un espacio vectorial sobre F. Entonces 


(a) f(T) es un operador lineal en V. 
(b) Si ß es una base ordenada finita para V y A = [T]g, entonces 
(M1 = f(A). 


DEMOSTRACIÓN. Ejercicio. 


Teorema E.4. Sea T un operador lineal en un espacio vectorial V sobre F, y sea 
A una matriz cuadrada con elementos de F. Entonces, para polinomios 
cualesquiera f,(x) y f.(x), con coeficientes de F 


(a) £MD£0) = £(M£(). 
(b) f(A)f(A) = f:(A)f (A). 


DEMOSTRACIÓN. Ejercicio. 
San, 


Teorema E.5. Sea T un operador lineal sobre un espacio vectorial V sobre un 
campo F, y sea A una matriz de n x n con elementos de F. Si £,(x) y 
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f(x) son polinomios primos relativos con elementos de F, entonces existen 
polinomios q,(x) y q(x) con elementos de F tales que 


(a) q(T)fi(T) + q (MET) =1 
(b) q(A)fi (A) + q(AJf¿(A) =I. 


DEMOSTRACIÓN. Ejercicio. 


En los Capítulos 5 y 6 nos interesa determinar cuándo un operador 
lineal T en un espacio vectorial dimensionalmente finito puede “diagonali- 
zarse”, así como encontrar una representación sencilla (canónica) de T. 
Ambos problemas son afectados por la factorización de un cierto polino- 
mio determinando por T (el “polinomio característico” de T). En este 
asunto tienen un papel importante algunas clases de polinomios. 


Definiciones. Un polinomio f(x) con coeficientes de un campo F, se llama 


mónico si su coeficiente principal (el de la potencia mayor) es 1. Si f(x) 
tiene grado positivo y no puede expresarse como un producto de polino- 
mios con coeficientes de F, cada uno de grado positivo, f(x) se denomina 
irreducible. 


Obsérvese que, el que un polinomio sea o no irreducible, depende del 
campo del que provengan sus coeficientes. Por ejemplo, f(x) = x? + 1 
es irreducible en el campo de los números reales, pero no lo es en el 
campo de los números complejos, puesto que x? + 1 = (x+1)(x— i). 

Evidentemente, un polinomio de grado 1 es irreducible. Más aún, para 
polinomios con coeficientes de un campo algebraicamente cerrado, los 
polinomios de grado 1 son los únicos polinomios irreducibles. 

Pueden establecerse fácilmente los siguientes hechos. 


Teorema E.6. Sean ¿(x) y f(x) polinomios con coeficientes de un campo F. 


Si p(x) es irreducible y (x) no divide a f(x), entonces ¿(x) y f(x) son 
primos relativos. 


DEMOSTRACIÓN. Ejercicio. 


Teorema E.7. Cualquier par de polinomios mónicos irreducibles distintos son 


primos relativos. 


DEMOSTRACIÓN, Ejercicio. 
TA 


Ahora estableceremos un resultado que conducirá a la demostración 
del teorema de factorización única para polinomios, el cual establece que 
todo polinomio de grado positivo es expresable de manera única como 
un producto de polinomios irreducibles mónicos multiplicado por una cons- 
tante. 
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Teorema E.8. Sean f(x), g(x) y $(x) polinomios con coeficientes del mismo 
campo. Si p(x) es irreducible y divide al producto f(x)g(x), entonces 
(x) divide a f(x) o p(x) divide a g(x). 


DEMOSTRACIÓN. Supóngase que (x) no divide a f(x). Entonces (x) 
y f(x) son primos relativos por el Teorema E.6 y, por lo tanto, existen 
polinomios q,(x) y q(x) tales que 


1 = 904) + q(x)f(x). 
Al multiplicar ambos lados de la ecuación por g(x) se tiene 
g(x) = qı(x)p(x)g(x) + qu) a) ex). (9) 


Como «¿(x) divide a f(x)g(x), existe un polinomio h(x) tal que 
f(x)g(x) = ¿(x)h(x). Y la Ecuación (9) se convierte en 


g(x) = ade (ade (xa) + q(x) (aj h(x) = 
= (2), (de (a) + 92600 hA(x)1. 
Por lo que (x) divide a g(x). E 


Corolario. Sean $(x), $1(x), ba(X), ... , n(x) polinomios mónicos irreduci- 
bles con coeficientes del mismo campo. Si (x) divide al producto 
HA) (A)... n(x), entonces p(x) = ¡(x) para alguna i(i = 1, 2,..., 
n). 


DEMOSTRACIÓN. Demostraremos el corolario por inducción sobre n. Para 
n= 1 el resultado es una consecuencia inmediata del Teorema E.7. Su- 
póngase entonces que el corolario es cierto para cualesquier n — 1 poli- 
nomios mónicos irreducibles y que contamos con n polinomios mónicos 
irreducibles $,(x), da(x), ... , n(x). Si p(x) divide al producto 
pı(x)ġ:(x) .. -$n x) = [p (x)(x) . «Prix lo (x), 

entonces, por el Teorema E.8, ¿(x) divide al producto ,(x)p2(x) ... 
... n(x) o (x) divide a (x). En el primer caso (x) = pi(x) 
para alguna i(i = 1, 2,..., n— 1), por la hipótesis de inducción; en 
el segundo caso, por el Teorema E.7, p(x) = n(x). E 


Ahora ya somos capaces de establecer el teorema de factorización 
única, que se utiliza a lo largo de los Capítulos 5 y 6. 


Teorema E.9. (Teorema de factorización única para polinomios.) Para cual- 
quier polinomio f(x) de grado positivo, existen una constante única c, poli- 
nomios mónicos irreducibles (Xx), p(X), ... , bu(X), PETOS positivos 
únicos nı, n2, ... , Dx tales que 


f(x) = cigi (x) 119200]... [9 (x)]™. 


DEMOSTRACIÓN. Principiaremos demostrando la existencia de tal factori- 
zación utilizando inducción sobre el grado de f(x). Si f(x) es de gra- 
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do 1, entonces f(x) = ax + b para algunas constantes a y b con a #0. 
Haciendo ¿(x) = x + b/a, tenemos que f(x) = a(x). Como ¿(x) es 
un polinomio mónico irreducible queda demostrado el resultado en este 
caso. Ahora supongamos que la conclusión es cierta para cualquier poli- 
nomio de grado positivo menor que algún entero n > 1 y sea f(x) un 
polinomio de grado n. Entonces 


NA) = anx" +... + ax + m 


para algunos escalares a; con a, Æ 0. Si f(x) es irreducible, entonces 


f(x) = an (x + E E ++) 
An An an). 
es una representación de f(x) como un producto de a, por un polinomio 
mónico irreducible. Si f(x) no es irreducible, entonces f(x) = g(x)h(x) 
para algunos polinomios g(x) y h(x), cada uno de grado positivo menor 
que n. La hipótesis de inducción garantiza que g(x) y h(x) se factorizan 
como productos de una constante por potencias de diferentes polinomios 
mónicos irreducibles. Por lo tanto, f(x) = g(x)h(x) también se factoriza 
de este modo. Así pues, en ambos casos f(x) puede ser factorizado como 
un producto de una constante por potencias de polinomios mónicos irre- 
ducibles. 
Falta establecer la unicidad de tal factorización. Supóngase que 


f(x) = cipi (0019200717... [ó (0) J> 


= dip (x) iya (x) ... [yo J”, (10) 
donde c y d son constantes, pi(x) y y;(x) son polinomios mónicos irre- 
ducibles, y n; y m; son enteros positivos (i = 1, 2,...,kyj=1,2,..., 


r). Claramente se ve que tanto c como d deben ser el coeficiente principal 
de f(x); por lo tanto, c = d, y la Ecuación (10) se transforma en 


[p G iga n. O = p ya n. pa (11) 


Así tenemos que ¢;(x) divide al lado derecho de la Ecuación (11) para 
¿=1,2,..., k. Consecuentemente, por el corolario del Teorema E.8, 
para cada i(i = 1, 2,... , k) ġi(x) = y;(x) para alguna j = 1, 2,...,T, 
y para cualquier j(j = 1, 2,..., r) y;¡(x) = $i(x) para alguna i= 1, 
2, ... , k. Concluimos que r= k y que, renumerando en caso de ser 
necesario, ġ:(x) = y;(x) para i = 1, 2,..., k. Supóngase que n; + m; 
para alguna i. Sin perder generalidad podemos suponer que ¿¡=1 y 
nm >m. Entonces, eliminando [¿$,(x)]"* de ambos lados de la Ecua- 
ción: (11) tenemos ES 


lpi (x) Pipa OT 00 = [20077 [OT (12) 


Como n, — m, > 0, $,(x) divide a la parte izquierda de la Ecuación (12) 
y por tanto también divide al lado derecho. Así, $,(x) = $ (x) para al- 
guna i = 2, ... , k, por el corolario al Teorema E.8. Pero esto contradice 
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el hecho de que $,(x), ġ2(x), ... , px(x) son distintos. Por lo tanto, las 
factorizaciones de f(x) en la Ecuación (10) son las mismas. MM 


Es a menudo útil considerar un polinomio f(x) = awx” +... + 
+ ax + a con coeficientes del campe F como una función f: F — F. 
En este caso, el valor de f en c EF es (c) = aac” +... + ac + a. Des- 
afortunadamente, para campos cualesquiera F, no existe correspondencia 
uno-a-uno entre polinomios y funciones polinomiales. Por ejemplo, si 
f(x) =x? y g(x) = x son dos polinomios del campo Z» (como se defi- 
nió en el Ejemplo 4 del Apéndice C), entonces f(x) y g(x) tienen grados 
diferentes y, por lo tanto, no son iguales como polinomios. Pero f(a) = 
= g(a) para toda a€Z,, y así f y g son funciones polinomiales iguales. 
Nuestro resultado final muestra que esta anomalía no puede ocurrir si F 
es un campo infinito. 


Teorema E.10. Sean f(x) y g(x) polinomios con coeficientes de un campo in- 
finito F. Si f(a) = g(a) para toda a €F, entonces f(x) y g(x) son iguales. 


DEMOSTRACIÓN. Supóngase que f(a) = g(a) para toda a€F. Defínase 
h(x) = f(x) — g(x) y supóngase que h(x) es de grado n > 1. Se tiene 
del corolario al Teorema E.9 que h(x) puede tener como máximo n ceros. 
Pero h(a) = f(a) — g(a) = O para cualquier a €F contradiciendo la hi- 
pótesis de que h(x) tiene grado positivo. Así, h(x) es un polinomio cons- 
tante y como h(a) = O para cada a €F se tiene que h(x) es el polinomio 
cero. Por lo tanto, f(x) = g(x). B 


Respuestas a los ejercicios 
seleccionados 


SECCION 1.1 


1. Sólo los pares de los incisos (b) y (c) son paralelos. 
2. (a) (3, -2,4) + 1(-8, 9, —3) 
(c) (3,7,2) + £(0, 0, —10) 
3. (a) (Q,-5, —1)+ 1(-2,9,7) + t2(—5, 12, 2) 
(c) (—-8,2,0) + 1,(9, 1,0) + 1,(14, —7, 0) 


SECCION 1.2 

1 (a) Vo b F © F  (d F (e) V  () F 
Y F (MF V HV k V 

3. Mr = 3, Ma = 4, y Mz =5 


4. (a) 6 3 2 (c) /8 20 —12 
ee 3 9) (a 0 23) 


(e) 2x4 + x? + 2x? — 2x + 10 
(g) 10x7 — 30x* + 40x — 15x 


13. No, (VS 4) falla. 
14. Sí. 
15. No. 


1. (a) F (b) F (c) V (d) F (e) V (€) F 
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(c) /-3 0 6 (e) ] 
( 9 2 1) =] 
3 
5 
11. No, el conjunto no es cerrado bajo la adición. 
14. Sí. 
SECCION 1.4 


1. (a) V (b) F (c) V (d) F (e) V (f) F 
2. (a) (x2(1,1,0,0) + x.(—3, 0, —2, 1) + (5,0, 4, 0): xz, x, ER} 
(c) No hay soluciones. 
(e)  (x3(10, —3, 1,0, 0) + x.(—3, 2, 0, 1, 0) + (—4, 3, 0, 0, 5): xa, X4 


ER) 
3. (a) Sí (c) No. (e) No. 
4. (a) Sí. (c) Sí. (e) No. 
SECCION 1.5 


SECCION 1.6 


ona 
. 


(a) F (b) V (c) F (d) F (e) V (f) F 

Y F MV OF GV dv MF 

2. (a) Sí. (c) Sí. (e) No. 

3. (a) No. (c) No. (e) No. 

4. No. 

5. No. 

8. (X,1, X3, Xs, X7) 

9. (di, 02,03, 04) = 01X, + (az — 41)x2 + (as — a2)x3 + (a, — az) xı 

10. dim(W,) = 3, dim(W,) = 2, dim(W, (+ W,) = 4, y dim(W, N W.) = 1 
17. n*-—1 

19 


in(n— 1) 


SECCION 1.7 


1. (a) F (b) F (c) F (d) V (e) V © V 
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SECCION 2.1 


1 a) vV (b) F (ce) F O V (e) Vo (ft) F 
(8) F W V G) F 


2. La nulidad es 1, y el rango es 2. T no es uno auno pero es sobreyectiva 
4. La nulidad es 4, y el rango es 2. T no es ni uno auno ni sobreyectiva 
5. La nulidad es 0, y el rango es 3. T es uno a uno pero no sobreyectiva 

10. T(2,3)= (5, 11). T es uno a uno 

12. No. 

SECCION 2.2 


l. (a) V (b) V (c) F (d) V (e) V ($) F 


2. (a) /2 —1 
2. f ¡ 
1 0 


3. po j =3 —Y 
(Ms=| 0 1] y mo 3 
go 0 4 $ 
5. (a) 110.0 0 (b) 0 1 0 (e) 1 
0010 2 22 —2 
0100 00 0 0 
0.0.0 1 0 0 2 4 
9. 1.1.0 0 
0 1 1 0 
0 1 


© 
(- 
© 
p 


SECCION 2.3 
ll a) F b V © F (d) V (e) F (1 F 
Y F wW F OVD yV 


2. (20 -9 18 B 
aoB +30) = (7, 10 3) y A(BD) = ( _36) 
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3. 2 3 0 l 1 0 2 6 6 
[T]; = (o 3 6}, [UI =[(0 0 1), y [UTR = (o 0 4 
0 0 4 bL =p Y 2 0 -6 


4. (a) l (c) (5) 


11. (a) No. (b) No. 
SECCION 2.4 
1. (a) F (b) V (c) F (d) F (e) V  (f) F 


gg V (ny V aü V 
17. (b) 


1 
0 
0 
0 
SECCION 2.5 


1. (a) F (b) V () V (d) F (e) V 


2. (a) a 4 (c) =1 3 
(a b) (E s) 


SECCION 2.6 


1. (a) F (b) V (c) V (d) V (e) F €) V 
(e) V (h) F 
2. Las funciones de los incisos (a), (c), (e) y (f) son funciones lineales. 
3 (a) fil, y, z) =x- 4y, h(x, y, z) = 4y, y falx, y, z)=-x+z 


5. La base para V es ([(p,(x), p.(x)), donde p,(x) = 2 — 2x y 
p:-(x) = —3+x. 
7. (a) T'(f) =g, donde g(a + bx) = —3a — 4b 
(b) tq8* — Sal 1 Y — —1 —2 
a) Sm 
SECCION 2.7 
1. (a) V (b) V (c) F (d) F (e) V (€) F 
(y V 
2. (a) F (b) V (co) V (d) V (e) F 
3. (a) (e*, te*) (c) (e*, tet, el, te!) 
(e) (e*, et cos 2t, e? sen 21) 
4. (a) [eE e‘! 2450/2) (c) (1, ent, ey 
SECCION 3.1 
1. (a) V (b) F (co) V (d) F (e) V (€) F 
(e) V (h) F G) V 
2. Añadiendo —2 veces la columna 1 a la columna 2 transforma A en B. 
SECCION 3.2 
1. (a) F (b) F (o) V (d) V (e) F €) V 
(gy V (h) V G) V 
(a) 2 (c) 2 (e) 3 (g) 1 
4. (a) 1000 
D=|0 1 0 0f; el rango es 2. 
00.00 
5. (a) El rango es 2, y la inversa es E Z) 
a ł 
(c) El rango es 3 y la inversa es| 4 0 —4 
eO E. 
(e) El rango es 3; por lo que no existe inversa. 
6. (a) T (ax? + bx + c) = —ax? — (4a + b)x— (10a + 2b + c) 
(c) Tila + bx +c) = (a, —żb + łc, —a + łb + łc) 
7. 1 
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— O |= 


( 


0 0 1 0 0/1 0 04/1 2 04 /1l 0 0 
1 0 1.1.0 (o =2 0 (o 1 o) 0 1 o) 
O 1 0 0 1/\0 O 1/X0 O 1/\0 —1 1 


0 
0 
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0 
1 
0 


1 
0 
1 


) 
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SECCION 3.3 


1. (a) F b F © V (d) F — (e) F  (f) F 
(8) V Q) F 


2. (a) 1 (c) A [3 l 
ll M: 
3 o-Pt1pPb0 

0 


| 1 1 0 
liI442l tER 
1 3 
(c) 1 2 3 1 
0 —1 0 0 
0 + 0 +!) 1 + f; ol' li, tan, t ER 
0 0 0 —] 


4. e 40 4 (c) /x, 3 
A a -e 
Sp p X3 =2 

y 1 

0 2 


7. Los sistemas de los incisos (b), (c) y (d) tienen soluciones. 

10. El agricultor, el sastre y el carpintero deben de tener ingresos en las pro- 
porciones 4: 3: 4, 

11. Deben de tener 7.8 unidades del primer bien y 9.5 unidades del segundo. 


SECCION 3.4 


1. (a) F (b) V (c) V (d) V (e) F ©) V 
(Y) V 
4. (a) 


0 2 
(c) No hay soluciones. 
SECCION 4.1 


1. (a) V (b) F (c) V (d) F (e) V €) F 
2. (a) 30 (c) —8 
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3. (a) —10 + 15i (c) —24 
4. (a) 19 (c) 14 
SECCION 4.2 
l (a) V (b) V (c) F (d) F (e) V (f) F 


3. (a) —34 (c) —49 
4. Las funciones en los incisos (c), (d) y (g) son 3— lineales. 


SECCION 4.3 
1 (a) Vo (b) vV © F 0V oF (f) V 
(8d) F (4 V vV GF K yV 


2. (a) 90 (c) 0 
3. (a) 100 (c) 0 (e) 86 (g) —180 + 40i 


SECCION 4.4 


2. (a) Ajo mis (c) =3i 0 0 
=A Ái 4 —1 +i 0 


10 + 16i —5 — 3i 3 + 3i 


(e) 6 22 12 18 28 —6 
12 —2 24 (g) —20 —21 37 
21 —38 —27 48 14 —16 
3. (a) PE biaz zap bto zà ban = bazı 
i 411432 — Gj2A21” i 411422 — Qi2đ21 


(c) x = —1, x = —1.2, x, = —1.4 
(e) x, = —43, x: = — 109, x, = -17 
SECCION 4.5 
1. (a) V (b) V (c) F (d) F (e) V O V 
2. (a) —1 (c) (—1)r™,/2 
(e) (1) 
SECCION 4.6 


1 (a) V DDV oov dA FEF @e F V 
(8) V hh) F OV OV KW V 
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2. (a) 22 (c) 2— 4i 


3. (a) —12 (c) 22 (e) -—3 
4. (a) 88 (c) —6 (e) 17— 3i (g) 24 + 24i 


SECCION 5.1 


1. (a) F (b) V (c) V (@A F (e) F (1D) F 
(g) F (h) V G) V G) F (k) F 


. =] 1 
g= (i 1) ma =(_7 24) 


3. (a) Los eigenvalores son 4 y —1, y una base de ejgenvectores es 


(HEY 26 -) 


(c) Los eigenvalores son 1 y —1, y una base de eigenvectores es 


(dle) 22d 1-1) 


4. Los eigenvalores son 1, 2 y 3, y una base de eigenvectores es (1, x, x?). 


SECCION 5.2 


1 (a) F (b) F (c) V (d) F (e) F Ð V 
(Y V (Q) F G) V 


2. (a) No diagonalizable. (c) 1 4 
Q= e 
(i 3) 
(e) No diagonalizable. (g) 1 1 1 
Q = 2 —1 0 
—1 0 1 
3. (a) No diagonalizable. (c) No diagonalizable. 
?. SEDE 26: A 
a 3 3 3 3 
E 260), SD 
3 3 3 3 


—2 
16. X(1) = cet ( 7 Foge? (1) 
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SECCION 5.3 


1. 


10. 


12. 
13. 


18. 


(a) V (b) V (c) F (d) F (e) V (€) V 
Y V MF F Gov 


(a) (0 0 A A (e) No existe límite. 
EMS >) 


13 
6 6 
T3 13» 
=A NS =z 

2 0 2 


Un mes después de su llegada 25% de los pacientes se han recuperado, 
20% son ambulatorios, 41% están en cama y 14% han muerto; eventual- 


(g) (- 0 2) No existe límite. 


59 31 
mente e se recuperan y 30 mueren. 


4 


Sólo las matrices de los incisos (a) y (b) son matrices regulares de tran- 
sición. 


(a) 3133 (c) No existen límites. 
( 3 ) 
3 4 
(e) 0 0 0 (9 [0000 
(: 1 o) 00.00 
3 0 1 J } 1 0 
4 4 0 1 


(a) 0.225 0.20 
0.441 } después de dos etapas y eventualmente | 0.60 


0.334 0.20 
(c) 0.368 0.50 
0.350 | después de dos etapas y eventualmente | 0.20 
0.282 0.30, 
(e) 0.329 3 
0.334 ] después de dos etapas y eventualmente | 4 
0.337 3 


9 6 "q. 4 “q. 
— Nuevas, -— utilizadas una vez y +7 utilizadas dos veces. 


En 1985 24% poseerán autos grandes, 34% poseerán autos de tamaño me- 
diano y 42% poseerán autos pequeños; las proporciones en un tiempo cual- 
quiera son 0.10, 0.30 y 0.60. 

e =I y el =el. 
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SECCION 5.4 
1. (a) F (b) V (e) V 


2. Los subespacios de los incisos (a), (c) y (d) son T-invariantes. 


SECCION 5.5 
l. (a) F (b) F (ce) V (d) V (e) V 


2. (a) (e,, €», €z, e4} (c) 0 1 
10) 
3. (a) (i) —«1-0D(2-31+ 3) (Gii) —4(1 — (E — 31+ 3) 
(c) (Gi) 1-t (Gi) (@— 1) (+1) 


SECCION 5.6 


1. (a) F (b) Vv (c) F (d) F (e) V (€) F 
(g) F (h) V 

2. (a) (1 1)(1- 3) (c) (1 1)*(t1— 2) 

3. (a) (1-2)? (c) (1 1)(1+ 1) 

5. Los operadores diagonalizables en R? que satisfacen a T? — 21? + T = To 
son To, | y aquellos operadores que tengan a O y a 1 como elgenvalores. 


SECCION 6.1 


1 (a) V (b) F (c) F (d) V (e) F (f) F 
(e) V (hb) V 
2. (a) Para à= 2, 


es una base para Ea; cualquier base para R? es una base para Ka. 
(b) Para1=-—1, 


es una base para Er y Ka. 
Para A = 2, 
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es una base para Er y 


0 /1 
11,1 1 


es una base para Ka. 


SECCION 6.2 


1 (a) V b) V () F © V (e) Vo (1 V 
(y F (h) V 


2. 2 1 0 21 4 1 0 
(o 2 Je Jona 4 Jomecra ia 
0.0 2 0 0 4 


3. (a) —(t— 2) (=> 3) 


(b) Para `à =2 A 


(c) à= 3 

(d) p=3 y p.=1 

(e) (i) rango(U,) = 3 y rango(U.) =0 
(ii) rango(U?) = 1 y rango(U2) = 0 
(iii) nulidad(U,) = 2 y nulidad(U,) = 2 
(iv) nulidad(U?) = 4 y nulidad(U?) = 2 


4. (a) EON A 
J=[0:2 1 y Q=|2 1 2 
00 2 1 —1 0 
(d) 0 100 I1 0 1 —l 
renco, ygs [p AN i 
0 0:2 0 baa 0 1 
0 0'0 2 1 01 0 
6. La forma canónica de Jordan es 
11 0;i0 
O 1 1:0 
o o 1ilof 
0 0 0'2 


y una base canónica de Jordan es {2e", 2xe”, x%e”, e7}. 
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SECCION 6.3 


1 (a) V (b) F () F (d V (e) F (1) V 


(g) F 
2. (a) 0 0 (b) 0 -—1 
( 0 2) (i -1) 
0 1 
(c) VS) 0 (e) [0 —2;0 0 
E H=1= WD) 1 0,0 0 
0 010 —3 
0 011 0 


SECCION 7.1 


l. (a) V b V (c) F (d) F (e) F (ft) F 
(Y V (h) F G) V 


2. (y) =54+i, |x= V7, |b| = vI% y [+ 


13 ST 
a o= M=% llls (2 


yi? = 37. 


> 


11 1 72,2 
y ll+el= JH 


SECCION 7.2 


1. (a) F (b) V (c) V (d) F (e) V (D V 
2. (b) La base ortonormal es 


La, 2D, vS- 2, 1, 1), Po, -1, DL 


Los coeficientes de Fourier son 2 V 3/3, — V6/6, y v2/2. 
(c) La base ortonormal es (1, 2,/3 (x — 4), 6/5 (x? — x + 2)). 
Los coeficientes de Fourier son 3/2, v 3/6, y 0. 
4. Sl= Ki, 3+(1 — i), —1)). 
5. En el primer caso, Sl es el plano que pasa por el origen que es perpen- 


dicular a xo; en el segundo caso SL es la recta que pasa por el origen 
que es perpendicular al plano que contiene a x, y xə. 
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SECCION 7.3 

1 (a) V (b) F (c) F (d) V (e) F (D vV 
(y) V 

2. (a) y= (l, —2, 4) (c) y= 210x? — 204x + 33 

3. (a) T*(x)= (11, —12) (c) T(f(x))= 7x2 +x + 12 


14. T*(x) = (x, z)y 


SECCION 7.5 


1. (a) V (b) F (c) F (d V (e) V (0 V 
(g) F (h) V 


2. (a) T es autoadjunto; la base ortonormal es [Go —2), la D}. 
v5 v5 


(b) T es normal pero no autoadjunto. 
(c) T no es normal. 


SECCION 7.6 


1. (a) F (b) V (c) V (d) F (e) F 
(a) v18 (c) 2 

4. (a) [Al = 84.74, ||4=|| = 17.01, y cond(4) = 1441 
(b) Iž — Abl <I1 4711114 —b/1=.17 y 


LZ — ACB — condea lè Z AIl y 14:41 
II ~ T 
s. 0001 < LX Z ŽI < 10 
1 
6. 


1 
d 2) >, NBIL=2, y  cond(B)=2 
3 


SECCION 7.7 


1 (a) V (b) F (c) F (d) V (e) F (0) V 
(8) F (h) F (G) F 
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(d) 1 1 1 
V2 V6 V3 
10.0 
1 1 1 
A A 0.04 
v6 v3 
4. T, es normal para toda z€ C; T, es autoadjunto si y sólo si z€ R; T, es 


unitario si y sólo si z = 1. 
5. Solamente el par de matrices en el inciso (d) es unitariamente equivalente. 


21. (c) 


] 1 2 
JE E A A E 
o=] -> El yer=|o vi 4 
1 
o 7 o e 
(e) x =3, x: = —5, x, =4 
1 1 1 1 
22. = —Y + —y' = — Y — —y 
(a) x o TA y y Toi wr 


La nueva forma cuadrática es 3(x')? — (y')?2. 


SECCION 7.8 


1 (a) F dv æ y (d) F (e) V (1) F 
e) F W V á V G) F 


3. TAGI ¡ER | 
a TOJ rer} si ġ=0 y eF P): rer] si #0 


) 
7. (c) Se tienen seis posibilidades: 


(i) Cualquier recta que pase por el origen si ¿ = y = 0. 


(ii) 0 
HO] teR sip9=0 y Yy=z_. 
1 


(iii) cos y +1 
t| —seny |: exl si p= r y y Ær. 


0 


Respuestas a los ejercicios seleccionados 533 


(iv) 0 
t| cosp= 1]: tER si y= r yo 7. 
sen $ 


(v) 0 
(1) tER si p=y=r. 
0 


(vi) sen ¿(cos y + 1) 
t — sen q sen y : PER para cualquier otra 
sen y(cos $ + 1) posibilidad. 


SECCION 7.9 


1. (a) F (b) V (c) V (d) V (e) V (£) F 
2. Para W= L({(1, 2))), m= h 


3. (ii) (a) T,(a, b)=3(a+b, a+b) y T:(a, b) = +(a— b, —a + b) 
(d) T,(a, b, c) = 4(2a — b — c, -—a+2b-.<c, 
—a — b + 2c) y T:(a, b, c) =4ł4(a+b+c,a+b+c, 


atb+c) 
SECCION 7.10 
, 12 4t 
2. La parábola es y = 373 + 2, y el error es 0. 


3. x=%y=3%z=) 


SECCION 7.11 
1. (a) F (b) F () V (d) F (e) V  (f) F 
(y F (h) F O V (MF 


4. (a) SÍ. (b) No. (c) No. (d) Sí. (e) Sí. 
= É No. 


5. (a) 0 2 -2 (b) 1 0 O 1 (c) Oo 0 0 0 
( 0 2) 0000 —1 0 —4 0 

1 1 0 0.0 0 0 0.0 0 0 

1 0O 0 1 -2 0 —8 0 
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22. 


23. 


33. 
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E 


l 2 


(b) La misma que (a). 


(c) LL 0 Ll 
JT 77 
o Ll 0 
LJ op LL 
JT JT 


Igual que 22(c). 


(c) 
o-| 
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C([0, 11) página 
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F página 
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